สารบัญ:
- Google Duplex คืออะไร
- นี่ไม่เหมือนกับการอ่านออกเสียงข้อความหรือไม่
- Duplex ทำงานอย่างไร
- เกี่ยวกับความปลอดภัยและความเป็นส่วนตัว
- ฉันจะมี Duplex บนโทรศัพท์ของฉันเมื่อใด
- ฉันจะเรียนรู้เพิ่มเติมได้ที่ไหน
ที่ Google I / O 2018 เราได้เห็นตัวอย่างของสิ่งใหม่ล่าสุดที่ยอดเยี่ยมของ Google คือ Duplex หน้าจอบนเวทีขนาด 60 ฟุตแสดงให้เห็นว่าแอพ Google Assistant ของคุณมีการเล่น Assistant บรรทัดต่อบรรทัดโดยการโทรหาช่างทำผมและตั้งค่าการนัดหมายเสร็จสมบูรณ์ด้วยการหยุด, ummms และ ahhhs และ ส่วนที่เหลือของนิสัยแปลกที่มาพร้อมกับคำพูดของมนุษย์ คนที่ทำการนัดหมายดูเหมือนจะไม่รู้ว่าพวกเขากำลังพูดคุยกับคอมพิวเตอร์เพราะมันฟังดูไม่เหมือนคอมพิวเตอร์ ไม่แม้แต่น้อย
การสาธิตแบบนั้นดูน่าทึ่ง (และอาจจะน่าขนลุกเล็กน้อย) แต่มีรายละเอียดอะไรบ้าง? เพล็กซ์คืออะไรกันแน่? มันทำงานได้ยังไง? เราทุกคนมีคำถามเมื่อเราเห็นสิ่งที่แตกต่างและการหาคำตอบที่แพร่กระจายผ่านอินเทอร์เน็ตนั้นเป็นเรื่องที่เจ็บปวด เรามาดูสิ่งที่เรารู้กันดีเกี่ยวกับ Google Duplex กันดีกว่า
Google Duplex คืออะไร
เป็นเครื่องมือใหม่จาก Google ที่มีวัตถุประสงค์เพื่อใช้ปัญญาประดิษฐ์ (AI) เพื่อ "ทำงานในโลกแห่งความจริงผ่านโทรศัพท์" ตามนักวิจัยและนักพัฒนา AI ของ Google สำหรับตอนนี้นั่นหมายถึงงานที่เฉพาะเจาะจงมากเช่นการนัดหมาย แต่เทคโนโลยีกำลังได้รับการพัฒนาโดยมุ่งเน้นการขยายไปสู่พื้นที่อื่น ๆ การใช้เวลานับพันล้านเพื่อสร้างวิธีที่ยอดเยี่ยมในการทำให้การจองอาหารค่ำดูเหมือนจะเป็นสิ่งที่ Google จะทำ แต่ไม่ใช่การใช้เวลาหรือเงินอย่างคุ้มค่า
ดูเพล็กซ์เป็นมากกว่าที่เราเห็นในการสาธิตและหากเคยออกจากห้องแล็บจะมากกว่าที่เราเห็นหรือได้ยินในตอนท้าย มีธนาคารข้อมูลขนาดใหญ่และคอมพิวเตอร์ที่ใช้ในการประมวลผลที่เกี่ยวข้องซึ่งแทบไม่เจ๋งเท่าผลลัพธ์สุดท้าย แต่สิ่งเหล่านี้มีความสำคัญเพราะทำให้คอมพิวเตอร์พูดและคิดในเวลาจริงเหมือนคนยาก
นี่ไม่เหมือนกับการอ่านออกเสียงข้อความหรือไม่
Nope ไม่ได้ใกล้เคียง. และนั่นเป็นเหตุผลที่มันเป็นเรื่องใหญ่
ดูเพล็กซ์ถูกออกแบบมาเพื่อเปลี่ยนวิธีที่คอมพิวเตอร์ "พูดคุย" บนโทรศัพท์
เป้าหมายของการดูเพล็กซ์คือการทำให้สิ่งต่าง ๆ ดูเป็นธรรมชาติและสำหรับผู้ช่วยในการคิดเพื่อค้นหาเวลานัดหมายที่ได้ผล ถ้าโจพูดว่า "ใช่เกี่ยวกับเรื่องนั้น - ฉันไม่มีอะไรเปิดจนกว่าจะถึง 10 นั่นก็โอเคไหม" ผู้ช่วยจำเป็นต้องเข้าใจในสิ่งที่โจกำลังพูดอยู่ลองคิดดูว่ามันหมายถึงอะไรและคิดว่าสิ่งใดที่โจเสนอจะใช้ได้ผลสำหรับคุณ หากคุณกำลังยุ่งอยู่ทั่วเมืองเวลา 10 และใช้เวลา 40 นาทีในการขับรถไปที่โรงรถของโจผู้ช่วยจะต้องสามารถคิดออกมาและพูดว่า 11:15 น่าจะดี
ความสำคัญเท่าเทียมกันสำหรับ Google คือการตอบกลับและเสียงเหมือนสองคน Google ได้กล่าวว่าต้องการให้บุคคลในโทรศัพท์ไม่ทราบว่าพวกเขากำลังคุยกับคอมพิวเตอร์ แต่ในที่สุดก็ตัดสินใจว่าจะเป็นการดีที่สุดที่จะแจ้งให้พวกเขาทราบ เมื่อเราพูดคุยกับผู้คนเราจะพูดได้เร็วขึ้นและเป็นทางการน้อยลง (อ่าน: พูดพล่ามไม่ชัดจากมุมมองของคอมพิวเตอร์) กว่าตอนที่เรากำลังพูดคุยกับผู้ช่วยทางโทรศัพท์หรือคอมพิวเตอร์ที่ DMV เมื่อเราโทรเข้า สิ่งนี้ และ สร้างใหม่เมื่อตอบกลับ
ในที่สุดและน่าประทับใจที่สุดคือการดูเพล็กซ์ต้องเข้าใจบริบท วันศุกร์วันศุกร์ หน้า และ วันศุกร์หลังจากสัปดาห์หน้า เป็นคำศัพท์ทั้งหมดที่คุณและฉันเข้าใจ เพล็กซ์ต้องเข้าใจพวกเขาด้วย ถ้าเราพูดแบบเดียวกับที่เราพิมพ์สิ่งนี้จะไม่เป็นปัญหา แต่เราอืมคุณรู้ไม่ได้เพราะมันฟังดูน่าเบื่อใช่มันไม่เหมือนกับสับสนแม้ว่าเราเคยได้ยินมาตลอดชีวิตของเราและคุ้นเคยกับมันดังนั้น ไม่เราไม่มีปัญหาที่คุณรู้ว่าเข้าใจหรือไม่เป็นเช่นนั้น
ฉันจะจัดการการปฐมพยาบาลให้กับบรรณาธิการของฉันหลังจากพิมพ์ในขณะที่คุณพูดออกมาดัง ๆ ดังนั้นคุณจะเห็นความหมายนี้
Duplex ทำงานอย่างไร
จากส่วนท้ายของผู้ใช้มันเป็นเรื่องง่ายเหมือนบอกผู้ช่วยให้ทำอะไรบางอย่าง สำหรับตอนนี้ดังกล่าวมีบางอย่าง จำกัด เพียงการนัดหมายดังนั้นเราจะพูดว่า "เฮ้กูเกิ้ลทำให้ฉันนัดเปลี่ยนน้ำมันที่โรงรถของโจในเช้าวันอังคาร" และ (หลังจากเตือนให้เราพูดว่าโปรด) มันจะโทร ตั้งค่าโรงรถของ Joe และตั้งค่าจากนั้นเพิ่มในปฏิทินของคุณ
สวยดี แต่สิ่งที่เกิดขึ้นนอกตัวกล้องนั้นยิ่งน่าเบื่อ
Duplex ใช้สิ่งที่เรียกว่าเครือข่ายประสาทกำเริบ มันสร้างขึ้นโดยใช้เทคโนโลยี TensorFlow Extended ของ Google Google ฝึกอบรมเครือข่ายในข้อความเสียงที่ไม่เปิดเผยชื่อและบทสนทนาของ Google Voice ที่คุณตกลงให้คุณฟังหากคุณเลือกใช้ซอฟต์แวร์การรู้จำเสียงที่ผสมผสานกันและความสามารถในการพิจารณาประวัติของการสนทนาและรายละเอียดเช่นเวลาของวันและสถานที่ ของทั้งสองฝ่าย
โดยพื้นฐานแล้วเครือข่ายทั้งหมดของคอมพิวเตอร์ที่ใช้พลังงานสูงกำลังบีบอัดข้อมูลในคลาวด์และพูดคุยผ่านผู้ช่วยบนโทรศัพท์หรือผลิตภัณฑ์อื่น ๆ ที่มีผู้ช่วยบนเครื่อง
เกี่ยวกับความปลอดภัยและความเป็นส่วนตัว
มันเป็นเรื่องง่าย: คุณเชื่อใจใน Google หรือไม่ ความฉลาดของเครื่องจักรบนอุปกรณ์เป็นเรื่องจริงแม้ว่ามันจะถูก จำกัด และค่อนข้างใหม่ Google ได้พัฒนา ML Kit เพื่อช่วยให้นักพัฒนาสามารถทำสิ่งนี้ได้มากขึ้นบนอุปกรณ์ แต่ก็เป็นเรื่องของพลังการประมวลผล ใช้การคำนวณจำนวนมากอย่างไม่น่าเชื่อในการนัดหมายผมด้วยวิธีนี้และไม่มีวิธีใดที่จะทำได้บนโทรศัพท์หรือหน้าแรกของ Google
คุณต้องไว้วางใจ Google ด้วยข้อมูลของคุณเพื่อใช้ผลิตภัณฑ์ที่ชาญฉลาดและ Duplex จะไม่แตกต่างกัน
Google ต้องแตะข้อมูลส่วนบุคคลของคุณเป็นจำนวนมากเพื่อทำสิ่งพิเศษที่ผู้ช่วยสามารถทำได้ในขณะนี้และเพล็กซ์ก็ไม่เปลี่ยนแปลง มีอะไรใหม่ที่นี่คือตอนนี้มีอีกฝ่ายที่เกี่ยวข้องซึ่งไม่ได้ให้สิทธิ์ Google อย่างชัดเจนในการฟังการสนทนาของพวกเขา
หาก / เมื่อดูเพล็กซ์กลายเป็นผลิตภัณฑ์สำหรับผู้บริโภคที่แท้จริงสำหรับทุกคนที่ใช้คาดว่ามันจะถูกวิพากษ์วิจารณ์และท้าทายในศาล และมันควรจะเป็น; การให้ Google ตัดสินว่าอะไรดีที่สุดสำหรับความเป็นส่วนตัวของเราก็เหมือนภาษิตเก่าแก่ของสุนัขจิ้งจอกสองตัวและไก่ตัดสินใจว่าอะไรเป็นอาหารเย็น
ฉันจะมี Duplex บนโทรศัพท์ของฉันเมื่อใด
ไม่มีใครรู้ในตอนนี้ มันอาจไม่เกิดขึ้น Google รู้สึกตื่นเต้นเมื่อสามารถทำสิ่งมหัศจรรย์ประเภทนี้และต้องการแบ่งปันกับโลก ไม่ได้หมายความว่ามันจะประสบความสำเร็จหรือเคยเป็นผลิตภัณฑ์จริง
สำหรับตอนนี้ Duplex กำลังถูกทดสอบในสภาพแวดล้อมแบบปิดและแบบมีผู้ควบคุม หากทุกอย่างดำเนินไปได้ด้วยดีการ ทดลอง เบื้องต้นให้กับผู้บริโภคเพื่อทำการจองร้านอาหารกำหนดเวลานัดร้านทำผมและรับชั่วโมงวันหยุดทางโทรศัพท์จะมาในปลายปีนี้โดยใช้ผู้ช่วยบนโทรศัพท์เท่านั้น
ฉันจะเรียนรู้เพิ่มเติมได้ที่ไหน
Google เปิดใจเกี่ยวกับเทคโนโลยีที่ใช้สร้างเพล็กซ์อย่างน่าประหลาดใจ คุณจะพบข้อมูลที่เกี่ยวข้องได้ที่เว็บไซต์ต่อไปนี้:
- บล็อก Google AI (Google)
- Deepmind
- Tensorflow.org
- ห้องสมุดมหาวิทยาลัยคอร์แนล
- Google Research (Google)
- คำหลัก (Google)
- ML Kit (Google)
แน่นอนเรากำลังติดตามดูเพล็กซ์อย่างใกล้ชิดและคุณจะได้ยินการพัฒนาล่าสุดที่นี่ทันทีที่มีให้