อัลกอริทึมควอนตัมจำแนกตัวเลขที่เขียนด้วยลายมือ 9,500 ตัว,

อัลกอริทึมควอนตัมจำแนกตัวเลขที่เขียนด้วยลายมือ 9,500 ตัว,

เครดิตฟรี

ในขณะที่ยังอยู่ในช่วงเริ่มต้น เนื่องจาก คอมพิวเตอร์ควอนตัม เข้าใกล้คอมพิวเตอร์แบบคลาสสิกมากขึ้น ระเบียบวินัยใหม่จึงเกิดขึ้นที่เรียกว่าการเรียนรู้ของเครื่องควอนตัม เป้าหมายของมันคือการนำการประมวลผลข้อมูลควอนตัมไปใช้กับงานการจดจำรูปแบบ เช่น การจัดประเภท การถดถอย และการจัดกลุ่ม โดยการใช้ควอนตัมบิต (qubits) แทนบิตไบนารีปกติ นักวิทยาศาสตร์คาดหวังว่าจะได้ผลลัพธ์ในชุดข้อมูลที่มีความซับซ้อนสูง เช่น ชุดข้อมูลที่พบในธรรมชาติ ในเวลาไม่กี่วินาทีแทนที่จะเป็นปี เร่งการค้นพบยาและยาใหม่ ๆ อย่างรวดเร็ว

สล็อต

คำถามพื้นฐานที่ว่าการคำนวณควอนตัมสามารถช่วยแก้ปัญหาการเรียนรู้ของเครื่องอย่างหนักได้หรือไม่ เพิ่งได้รับความสนใจอย่างมากจากการเรียนรู้ของเครื่องและชุมชนข้อมูลควอนตัม เมื่อไม่กี่สัปดาห์ก่อน สมาชิก 40 คนของชุมชนนี้ รวมทั้งนักฟิสิกส์ นักคณิตศาสตร์ และนักวิทยาศาสตร์คอมพิวเตอร์ รวมตัวกันในแอฟริกาใต้เพื่อเข้าร่วมเวิร์กช็อป 10 วันเพื่อพูดคุยเกี่ยวกับการเรียนรู้ของเครื่องควอนตัมและเพื่อทดสอบทักษะของพวกเขากับความท้าทายในการเขียนโปรแกรมที่ไม่เหมือนใคร
ความท้าทายคือการจำแนกชุดข้อมูลตัวเลขที่เขียนด้วยลายมือของ MNIST ออกเป็นสองกลุ่ม ชุดข้อมูลประกอบด้วยภาพ 9,586 ภาพที่เขียนด้วยลายมือ 3 และ 8 ภาพแต่ละภาพมีขนาด 28 x 28 พิกเซล สี่เหลี่ยมจัตุรัส หรือทั้งหมด 784 พิกเซล
มีเก้าทีมที่เข้าแข่งขันและส่งผลการแข่งขัน แต่ละทีมประกอบด้วยนักพัฒนาหนึ่งคนและนักวิจัยรุ่นใหม่ที่มีแนวโน้มว่าจะคำนวณควอนตัมและข้อมูลควอนตัม
Waheeda Saib จากห้องปฏิบัติการวิจัย IBM ในโจฮันเนสเบิร์ก เป็นนักพัฒนาหญิงเพียงคนเดียวจากโปรแกรมเมอร์ 9 คนที่เข้าร่วม ซึ่งไม่ได้ทำให้เธอประหลาดใจ
เธอแสดงความคิดเห็นว่า “มีการรับรู้ในสังคมว่าการพัฒนาซอฟต์แวร์เป็นสาขาที่ครอบงำโดยผู้ชายเนื่องจากตัวเลขอย่าง Bill Gates และ Steve Jobs แต่คุณจะรู้สึกลำบากใจที่จะหาอาจารย์พูดถึง Ada Lovelaceผู้สร้างอัลกอริทึมคอมพิวเตอร์เครื่องแรกของโลก หรือ Grace Hopperผู้คิดค้นคอมไพเลอร์ตัวแรกสำหรับภาษาการเขียนโปรแกรม เราต้องการการเปลี่ยนแปลงความคิด มิฉะนั้นสิ่งนี้จะไม่ก้าวหน้า”
แม้ว่าการจำแนกประเภทของชุดข้อมูล MNIST จะได้รับการทดลองและทดสอบกับโมเดลการเรียนรู้ของเครื่องคลาสสิกและการเรียนรู้เชิงลึกส่วนใหญ่แล้ว และยังคงเป็นความท้าทายKaggleแบบเปิดทีมของเธอคิดว่าการสร้างแบบจำลองการเรียนรู้ของเครื่องควอนตัมเพื่อจำแนกตัวเลขคงเป็นเรื่องแปลกใหม่
Saib กล่าวเสริมว่า “จากประสบการณ์ของฉันในโครงการการรายงานโรคมะเร็งซึ่งใช้การเรียนรู้เชิงลึกเพื่อดึงแนวคิดทางการแพทย์ที่เกี่ยวข้องออกจากรายงานทางพยาธิวิทยา ฉันรู้ว่าฉันสามารถใช้แบบจำลองการเรียนรู้เชิงลึกที่สามารถใช้ร่วมกับอัลกอริธึมการจำแนกประเภทควอนตัมอย่างง่ายได้ ดังนั้นฉันจึงแนะนำแนวทางนี้ให้กับทีม ซึ่งท้าทายคนอื่นๆ ให้หาวิธีนำแบบจำลองการจัดประเภทควอนตัมไปใช้”
โดยมีการบรรยายตั้งแต่ 9.00 – 5.30 น. ทุกวันสายบและทีมงานพบกันในช่วงบ่ายและช่วงเย็นเพื่อทำงานเป็นนางแบบ เมื่อเวลา 04.00 น. และเหลือเวลาอีกห้าชั่วโมง ในที่สุดพวกเขาก็เสร็จสิ้นการเข้ารหัสและทดสอบก่อนการนำเสนอและการประเมินขั้นสุดท้าย
โชคดีที่ความพยายามได้รับการตอบแทน แม้จะมีความพ่ายแพ้ในช่วงต้นๆ เพียงเล็กน้อย แต่ทีมก็ชนะ ‘โซลูชันที่สร้างสรรค์/แปลกใหม่ที่สุด’ โดยเป็นทีมเดียวที่ใช้อัลกอริทึมการจำแนกควอนตัมการเรียนรู้เชิงลึก
Saib กล่าวเสริมว่า “เราทำงานกับเครื่องจำลองควอนตัมที่สร้างขึ้นสำหรับการประชุมเชิงปฏิบัติการและใช้IBM Quantum Experience แบบ 5 บิต เพื่อนำแนวคิดที่เรียนรู้ในการบรรยายเกี่ยวกับคอมพิวเตอร์ควอนตัมมาใช้ ไอบีเอ็มควอนตัมประสบการณ์ค่อนข้างง่ายต่อการใช้และเราถือว่าใช้มันเพื่อเรียกใช้อัลกอริทึมควอนตัมของเรา แต่การเชื่อมต่ออินเทอร์เน็ตของเราคือไม่เหมาะดังนั้นเราจึงใช้ที่กล่องควอนตัมในห้องสมุดหลาม (QuTIP) แต่สิ่งที่สำคัญที่สุดคือเราได้ผลลัพธ์ที่ดี ซึ่งเทียบเท่ากับโมเดลการเรียนรู้ของเครื่องแบบคลาสสิก ไม่เลวเลยที่เราทำสิ่งนี้ภายในเวลาไม่ถึงสี่วัน”
บางทีที่น่าประทับใจยิ่งกว่านั้นก็คือ Saib เพิ่งตัดสินใจที่จะเน้นงานของเธอเกี่ยวกับการคำนวณควอนตัมในเดือนตุลาคม 2014
เธอเสริมว่า “ฉันกำลังดูสารคดีของ BBC เรื่อง “ Defeating the Hackers ” และมันเปลี่ยนชีวิตฉัน สารคดีนี้ได้แนะนำให้ฉันรู้จักกับความก้าวหน้าในการคำนวณควอนตัมและศักยภาพในการทำลายปัญหาที่ถือว่าแก้ไขไม่ได้ ซึ่งอาจส่งผลกระทบอย่างมีนัยสำคัญในด้านการแพทย์ ธุรกิจ และความปลอดภัย ตอนนั้นเองที่ฉันได้ตระหนักถึงสาขาการวิจัยที่ฉันต้องการเชี่ยวชาญ สิ่งนี้กระตุ้นให้ฉันลาออกจากการเป็นวิศวกรซอฟต์แวร์ เพื่อไล่ตามความฝันของฉันในการเป็นนักวิทยาศาสตร์ด้านการวิจัย โดยมุ่งเน้นที่การคำนวณควอนตัมและการเรียนรู้ของเครื่องควอนตัม”
ความท้าทาย #2: ระบบไดอะล็อกแบบ end-to-end ใหม่ ซึ่งสามารถจัดการกับพฤติกรรมผู้ใช้ใหม่ในการปรับใช้ด้วยการแทรกแซงจากตัวแทน
ระบบไดอะล็อกเชิงเป้าหมายแบบ end-to-end ของระบบประสาทแสดงให้เห็นถึงสัญญาว่าจะลดปริมาณงานของตัวแทนที่เป็นมนุษย์สำหรับการบริการลูกค้า รวมทั้งลดเวลารอสำหรับผู้ใช้ อย่างไรก็ตาม การไม่สามารถจัดการกับพฤติกรรมของผู้ใช้ใหม่ได้จำกัดการใช้งานสำหรับการใช้งานจริง ในงานนี้ เราขอเสนอวิธีการฝึกหัดแบบ end-to-end ใหม่สำหรับระบบโต้ตอบเชิงเป้าหมายของระบบประสาท ซึ่งจัดการพฤติกรรมผู้ใช้ใหม่โดยการถ่ายโอนกล่องโต้ตอบไปยังตัวแทนมนุษย์
ระบบไดอะล็อกสามารถระบุพฤติกรรมผู้ใช้ใหม่ได้โดยอัตโนมัติในระหว่างการปรับใช้ที่ระบบอาจล้มเหลวและถ่ายโอนงานไปยังตัวแทนที่เป็นมนุษย์ เพื่อให้งานของผู้ใช้เสร็จสมบูรณ์โดยไม่มีปัญหาใดๆ ในเวลาเดียวกัน ระบบไดอะล็อกยังเรียนรู้จากการตอบสนองของตัวแทนมนุษย์เพื่อจัดการกับพฤติกรรมผู้ใช้ใหม่นั้นในอนาคต วิธีการของเรายังช่วยให้นักออกแบบผู้ช่วย AI สามารถเลือกการแลกเปลี่ยนระหว่างการเพิ่มความสำเร็จให้กับงานของผู้ใช้สูงสุด และลดภาระงานของตัวแทนที่เป็นมนุษย์ให้น้อยที่สุด วิธีการที่เสนอมีสามเป้าหมาย:
เพิ่มความสำเร็จของงานของผู้ใช้โดยถ่ายโอนไปยังตัวแทนที่เป็นมนุษย์
ลดภาระของตัวแทนมนุษย์โดยถ่ายโอนไปยังพวกเขาเมื่อจำเป็นเท่านั้นและ
เรียนรู้ออนไลน์จากการตอบสนองของตัวแทนมนุษย์เพื่อลดภาระของตัวแทนมนุษย์ต่อไป
เราประเมินวิธีการที่เราเสนอในงานไดอะล็อกแบบดัดแปลง-bAbI ซึ่งจำลองสถานการณ์ของพฤติกรรมผู้ใช้ใหม่ที่เกิดขึ้นในขณะทดสอบ

สล็อตออนไลน์

แสดงตัวอย่างไดอะล็อกจากงานไดอะล็อก modified-bAbI ซึ่งเป็นส่วนขยายของงานไดอะล็อก original-bAbI (Bordes et al., 2017) [6] เราแก้ไขงานไดอะล็อกดั้งเดิม-bAbI โดยลบและแทนที่พฤติกรรมผู้ใช้บางอย่างจากข้อมูลการฝึกอบรมและการตรวจสอบ ชุดทดสอบไม่ถูกแตะต้อง สิ่งนี้จำลองสถานการณ์ที่พฤติกรรมผู้ใช้ใหม่เกิดขึ้นระหว่างเวลาทดสอบ (การทำให้ใช้งานได้) ซึ่งไม่เห็นในระหว่างการฝึกอบรม และทำให้เราสามารถทดสอบวิธีที่เราเสนอได้ นอกจากนี้ยังเลียนแบบการรวบรวมข้อมูลในโลกแห่งความเป็นจริงผ่าน crowdsourcing ในแง่ที่ว่าพฤติกรรมของผู้ใช้บางอย่างหายไปจากข้อมูลการฝึกอบรม
วิธีการที่เราเสนอแสดงในรูปที่ 3 (ขวา) พิจารณาโมเดลไดอะล็อกประสาท (M) ที่ได้รับการฝึกฝนสำหรับงานไดอะล็อกที่เน้นเป้าหมาย เรายังมีตัวแทนมนุษย์ (H) ที่ได้รับการฝึกฝนสำหรับงานเดียวกัน ทั้ง (M) และ (H) สามารถใช้กล่องโต้ตอบเป็นอินพุตและสร้างคำตอบสำหรับคำพูดของผู้ใช้ (u) มีตัวแยกประเภทประสาท (C) ซึ่งใช้เวกเตอร์สถานะไดอะล็อกจากแบบจำลอง (M) เป็นอินพุตและตัดสินใจว่าจะใช้แบบจำลอง (M) เพื่อให้ตอบสนองต่อผู้ใช้หรือโอนไปยังตัวแทนของมนุษย์ (H) ผู้ที่สามารถให้คำตอบกับผู้ใช้ได้
วิธีการที่เราเสนอให้กรอบใหม่สำหรับการเรียนรู้และการฝึกอบรมระบบการสนทนาที่เน้นเป้าหมายสำหรับโลกแห่งความเป็นจริง วิธีการที่เสนอนี้ช่วยให้เราเพิ่มอัตราความสำเร็จของผู้ใช้ได้สูงสุดโดยใช้ตัวแทนที่เป็นมนุษย์น้อยที่สุดแทนรูปแบบการโต้ตอบสำหรับกรณีที่แบบจำลองอาจล้มเหลว การประเมินของเราเกี่ยวกับงานไดอะล็อกแบบแก้ไข-bAbI แสดงให้เห็นว่าวิธีการที่เสนอของเรามีประสิทธิภาพในการบรรลุเป้าหมายที่ต้องการ วิธีการของเราช่วยให้ผู้ออกแบบสามารถกำหนดจุดประนีประนอมระหว่างความสำเร็จของงานที่ต้องการของผู้ใช้กับปริมาณงานของตัวแทนที่เป็นมนุษย์ เราเชื่อว่าสิ่งนี้จะเปิดทิศทางการวิจัยใหม่และมีแนวโน้มว่าจะจุดประกายให้เกิดการใช้ระบบการสนทนาแบบ end-to-end ที่มุ่งเน้นเป้าหมายในโลกแห่งความเป็นจริงเพิ่มขึ้นในไม่ช้า
กระดาษที่ได้รับการยอมรับจาก TALC เรื่อง “ การเรียนรู้กล่องโต้ตอบที่เน้นเป้าหมายแบบ end-to-End ด้วยความสำเร็จสูงสุดของงานผู้ใช้และการใช้ตัวแทนมนุษย์น้อยที่สุด”จะเป็นส่วนหนึ่งของการนำเสนอแบบปากเปล่า 2 ในวันจันทร์ที่ 29 กรกฎาคม เวลา 14:50 น.
หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับบทความเรื่อง “ A Large-Scale Corpus for Conversation Disentanglement ” มาเยี่ยมชมเราได้ที่ ACL 2019 Poster session 5A: Dialogue and Interactive Systems (ARSENALE) ในวันอังคารที่ 30 กรกฎาคม เวลา 13:50–15:30 น.
ตัวช่วยโต้ตอบที่ขับเคลื่อนด้วยปัญญาประดิษฐ์ (AI) ถูกใช้ในกิจวัตรประจำวันของเรา เช่น การตรวจสอบสภาพอากาศ การค้นหาร้านอาหาร การโทร และอื่นๆ อีกมากมาย ในการตั้งค่าองค์กร ผู้ช่วยเหล่านี้มีประโยชน์อย่างมากในสถานการณ์การสนับสนุนลูกค้า ซึ่งช่วยลดต้นทุนขององค์กรและให้ความช่วยเหลือผู้ใช้อย่างรวดเร็วและแม่นยำ
อย่างไรก็ตาม ผู้ช่วยไดอะล็อกที่ขับเคลื่อนด้วย AI จำนวนมากในปัจจุบันอาศัยแนวทางที่ได้รับการตั้งโปรแกรมไว้อย่างชัดเจนโดยนักออกแบบไดอะล็อก ความต้องการหลักสำหรับความก้าวหน้าทางวิทยาศาสตร์คือการพัฒนาอัลกอริธึมที่สามารถเรียนรู้การโต้ตอบแบบโต้ตอบที่มุ่งเน้นเป้าหมายได้อย่างมีประสิทธิภาพจากบันทึกการแชทระหว่างคนสู่คน ในขณะที่ใช้แหล่งข้อมูลภายนอกที่เกี่ยวข้อง IBM Research AIและ University of Michigan เป็นผู้นำทิศทางการวิจัยนี้ด้วยการจัดการแข่งขันสาธารณะเพื่อสร้างแรงบันดาลใจและประเมินแนวทางใหม่ที่จะนำไปสู่ระบบการสนทนาที่ขับเคลื่อนด้วย AI รุ่นต่อไป
[NPC4]การแข่งขันนี้เรียกว่า NOESIS II: Predicting Responses, Identifying Success และ Managing Complexity in Task-Oriented Dialog เสนอให้ใน Track 2 ของ Dialog Systems Technology Challenge 8 ( DSTC 8 ) การแข่งขันได้เปิดขึ้นแล้ว โดยจะส่งผลงานได้ภายในวันที่ 6 ตุลาคม ผู้ชนะจะประกาศในวันที่ 20 ตุลาคม และผู้เข้าร่วมจะได้รับเชิญให้นำเสนอผลงานของพวกเขาในเวิร์กช็อปที่จะจัดขึ้นในการประชุมชั้นนำเพื่อเสนอชื่อในภายหลัง ผู้เข้าร่วมระดับสูงจะได้รับเชิญให้ส่งผลงานของพวกเขาไปยังวารสาร Computer Speech and Language (CS&L) ฉบับพิเศษ
อ่านเพิ่มเติมและลงทะเบียนเลย !
การแข่งขันสร้างจากความสำเร็จของDSTC 7 Track 1ซึ่ง IBM Research AI และ University of Michigan จัดขึ้นเมื่อปีที่แล้ว มีทีมนักวิชาการและอุตสาหกรรมเข้าร่วมมากกว่า 20 ทีมทั่วโลก ปีนี้เราให้ส่วนขยายกับงานโดยผสมผสานองค์ประกอบใหม่ที่มีความสำคัญสำหรับการสร้างระบบกล่องโต้ตอบที่เน้นงานที่ปรับใช้ได้
ชุดข้อมูล
ความท้าทายนี้นำเสนอด้วยชุดข้อมูลไดอะล็อกที่เน้นเป้าหมายสองชุด:
A. ชุดข้อมูล Ubuntu
ชุดข้อมูลประกอบด้วยการสนทนาหลายฝ่ายที่ดึงมาจากช่อง Ubuntu Internet Relay Chat (IRC) กล่องโต้ตอบทั่วไปเริ่มต้นด้วยคำถามที่ผู้เข้าร่วม_1ถาม จากนั้นผู้เข้าร่วมคนอื่นๆ จะตอบกลับด้วยคำตอบหรือคำถามติดตามผล จากนั้นจึงนำไปสู่การสนทนาแบบกลับไปกลับมา นอกจากนี้ยังมีข้อมูลภายนอกที่เกี่ยวข้องในรูปแบบของหน้าคู่มือ Linux และฟอรัมสนทนาของ Ubuntu
B. การแนะนำชุดข้อมูล
ชุดข้อมูลนี้มีกล่องโต้ตอบสองฝ่ายที่จำลองการสนทนาระหว่างนักเรียนกับอาจารย์ที่ปรึกษาทางวิชาการ วัตถุประสงค์ของการสนทนาคือเพื่อเป็นแนวทางให้นักเรียนเลือกหลักสูตรที่ไม่เพียงแต่เหมาะกับหลักสูตรเท่านั้น แต่ยังรวมถึงความชอบส่วนตัวเกี่ยวกับเวลา ความยาก พื้นที่ที่น่าสนใจ ฯลฯ บทสนทนาเหล่านี้รวบรวมโดยให้นักศึกษาที่มหาวิทยาลัยมิชิแกนทำหน้าที่ใน สองบทบาทโดยใช้บุคลิกที่จัดให้ ข้อมูลที่มีโครงสร้างในรูปแบบของฐานข้อมูลของข้อมูลหลักสูตรจะถูกจัดเตรียมไว้เช่นเดียวกับตัวบุคคล ข้อมูลยังรวมถึงการถอดความประโยคและการตอบสนองต่อเป้าหมาย
งานย่อย
ความท้าทายนี้มีให้พร้อมกับงานย่อยสี่งาน ผู้เข้าร่วมอาจมีส่วนร่วมในงานย่อยหนึ่งงาน มากกว่าหนึ่งงาน หรือทั้งหมด งานหลักตามบริบทของการโต้ตอบคือการเลือกเทิร์นถัดไปในการสนทนาจากชุดคำพูดของผู้สมัครที่กำหนด
แม้จะมีทีมกฎหมายที่มีความสามารถจำนวนมาก การทบทวนสัญญาทำให้เกิดปัญหาคอขวดในทุกสิ่งตั้งแต่การขายไปจนถึงซัพพลายเชน งานสำคัญนี้มีศักยภาพที่จะทำให้น่าเบื่อน้อยลงและมีประสิทธิภาพมากขึ้นด้วยความช่วยเหลือของการประมวลผลภาษาธรรมชาติ (NLP) จากการวิจัย NLP ที่IBM Research-Almadenมากว่าทศวรรษทีมงานของเรามุ่งมั่นที่จะพัฒนาเครื่องมือที่สามารถช่วยให้เครื่องจักรเข้าใจภาษากฎหมาย และทำให้ AI สามารถอธิบายและปรับเปลี่ยนได้สำหรับนักกฎหมายและฆราวาส
[NPC5]ในการประชุมประจำปีครั้งที่ 57 ของ Association for Computational Linguistics ( ACL 2019 ) เราจะนำเสนอ “ HEIDL: Learning Linguistic Expressions with Deep Learning and Human-in-the-Loop ” ซึ่งแสดงให้เห็นถึงรูปแบบที่ช่วยให้ผู้คนง่ายขึ้นและเร็วขึ้นมาก เพื่อตรวจสอบประสิทธิภาพของป้ายกำกับภาษาธรรมชาติที่สร้างโดยโมเดลการเรียนรู้เชิงลึกซึ่งฝึกฝนเกี่ยวกับข้อมูลที่ติดป้ายกำกับโดยมนุษย์