Get in my Think Art.

ความก้าวหน้าและความท้าทายด้าน AI อันดับต้นๆ ของปี 2017 กับ Richard Mallah และ Chelsea Finn

ความก้าวหน้าและความท้าทายด้าน AI อันดับต้นๆ ของปี 2017 กับ Richard Mallah และ Chelsea Finn

ความก้าวหน้าและความท้าทายด้าน AI อันดับต้นๆ ของปี 2017 กับ Richard Mallah และ Chelsea Finn

jumbo jili

AlphaZero, ความคืบหน้าในการเรียนรู้เมตา, บทบาทของ AI ในข่าวปลอม, ความยากลำบากในการพัฒนาแมชชีนเลิร์นนิงอย่างยุติธรรม — ปี 2017 เป็นอีกปีแห่งการค้นพบครั้งยิ่งใหญ่และความท้าทายครั้งใหญ่สำหรับนักวิจัย AI!
เพื่อพูดคุยเรื่องนี้มากขึ้น เราได้เชิญ Richard Mallah จาก FLI และ Chelsea Finn จาก UC Berkeley ให้เข้าร่วมกับ Ariel สำหรับพอดคาสต์ของเดือนนี้ พวกเขาพูดถึงความก้าวหน้าทางเทคนิคบางอย่างที่พวกเขาตื่นเต้นที่สุดที่จะได้เห็นและสิ่งที่พวกเขาตั้งตารอในปีหน้า

สล็อต

เอเรียล:ฉันชื่อเอเรียล คอนน์ สถาบันอนาคตแห่งชีวิต ในปี 2560 เราเห็นการลงทุนด้านปัญญาประดิษฐ์เพิ่มขึ้น มีนักศึกษาสมัครโปรแกรม AI มากขึ้น และมีห้องปฏิบัติการ AI เพิ่มขึ้นทั่วโลก ในปี 2017 ที่อยู่เบื้องหลังเราอย่างแน่นหนา เราต้องการมองย้อนกลับไปในปีนั้นและทบทวนความก้าวหน้าของ AI ที่ยิ่งใหญ่ที่สุดบางส่วน ในการทำเช่นนั้น วันนี้ฉันมี Richard Mallah และ Chelsea Finn อยู่กับฉัน
Richard เป็นผู้อำนวยการโครงการ AI กับเราที่ Future of Life Institute ซึ่งเขาทำการวิจัยอภิมาน วิเคราะห์ และสนับสนุนเพื่อให้ AI ปลอดภัยและเป็นประโยชน์ Richard มีประสบการณ์ด้าน AI มาเกือบสองทศวรรษในอุตสาหกรรม และปัจจุบันยังเป็นหัวหน้าฝ่ายวิจัยและพัฒนา AI ของบริษัทจัดหางานระบบอัตโนมัติ Avrio AI เขายังเป็นผู้ร่วมก่อตั้งและหัวหน้าเจ้าหน้าที่วิทยาศาสตร์ข้อมูลของบริษัทวางแผนการตลาดเนื้อหา MarketMuse
Chelsea เป็นผู้สมัครระดับปริญญาเอกด้านวิทยาการคอมพิวเตอร์ที่ UC Berkeley และเธอสนใจว่าการเรียนรู้อัลกอริธึมช่วยให้หุ่นยนต์มีสามัญสำนึกได้อย่างไร ทำให้พวกเขาได้เรียนรู้ทักษะการเคลื่อนไหวทางประสาทสัมผัสที่ซับซ้อนหลากหลายในสภาพแวดล้อมจริง เธอสำเร็จการศึกษาระดับปริญญาตรีที่ MIT และเคยทำงานที่ Google Brain ด้วย
Richard และ Chelsea ขอบคุณมากสำหรับการมาที่นี่
เชลซี:มีความสุขที่ได้อยู่ที่นี่
ริชาร์ด:เช่นเดียวกับฉัน
Ariel:ปกติแล้วฉันใช้เวลารวบรวมคำถามสำหรับแขกรับเชิญ แต่วันนี้ Richard และ Chelsea เลือกหัวข้อ ความก้าวหน้าทางเทคนิคหลายอย่างที่พวกเขารู้สึกตื่นเต้นเกี่ยวกับความก้าวหน้าทางเทคนิคเบื้องหลังที่อาจไม่ค่อยน่าตื่นเต้นสำหรับสื่อทั่วไป อย่างไรก็ตาม มีข้อยกเว้นอยู่อย่างหนึ่ง นั่นคือ AlphaZero
AlphaZero ซึ่งเป็นผลงานต่อจาก AlphaGo ของ DeepMind ได้สร้างกระแสให้กับสื่อมวลชนที่ได้รับความนิยมในเดือนธันวาคม เมื่อมันประสบความสำเร็จในทักษะเหนือมนุษย์ที่ Chess, Shogi และ Go โดยไม่ได้รับความช่วยเหลือจากมนุษย์ ดังนั้น Richard และ Chelsea ฉันหวังว่าคุณจะสามารถบอกเราเพิ่มเติมเกี่ยวกับ AlphaZero ได้อย่างไร มันทำงานอย่างไร และเหตุใดจึงเป็นเรื่องใหญ่ เชลซี ทำไมเราไม่เริ่มต้นกับคุณล่ะ?
เชลซี : ใช่แล้ว DeepMind เริ่มต้นด้วยการพัฒนา AlphaGo เมื่อสองสามปีก่อน และ AlphaGo เริ่มการเรียนรู้โดยการดูการเล่นของผู้เชี่ยวชาญของมนุษย์ ดูว่าผู้เชี่ยวชาญของมนุษย์เล่นอย่างไร วิเคราะห์กระดานอย่างไร จากนั้นเมื่อวิเคราะห์และเริ่มต้นด้วย ผู้เชี่ยวชาญของมนุษย์ก็เริ่มเรียนรู้ด้วยตัวเอง
สิ่งที่น่าตื่นเต้นเกี่ยวกับ AlphaZero คือระบบเริ่มต้นขึ้นเองทั้งหมดโดยปราศจากความรู้ของมนุษย์ มันเริ่มต้นจากสิ่งที่เรียกว่า “การเล่นด้วยตัวเอง” โดยที่เอเย่นต์ซึ่งผู้เล่นประดิษฐ์นั้นเล่นกับตัวเองเป็นหลักตั้งแต่เริ่มต้นและเรียนรู้อย่างสมบูรณ์ด้วยตัวของมันเอง
และฉันคิดว่าสิ่งหนึ่งที่น่าตื่นเต้นจริงๆ เกี่ยวกับการวิจัยครั้งนี้และผลลัพธ์ก็คือ AlphaZero สามารถทำงานได้ดีกว่าโปรแกรม AlphaGo ดั้งเดิม และโดยเฉพาะอย่างยิ่ง สามารถทำงานได้ดีกว่าโดยเอาความเชี่ยวชาญของมนุษย์ออก โดยการเอาข้อมูลที่มนุษย์ป้อนออกไป ดังนั้นฉันคิดว่านี่แสดงให้เห็นว่าบางทีถ้าเราสามารถก้าวไปสู่การขจัดอคติของมนุษย์ ลบข้อมูลที่มนุษย์ป้อนเข้าไป และเคลื่อนไปสู่สิ่งที่เรียกว่าการเรียนรู้แบบไม่มีผู้ดูแลมากขึ้น ซึ่งระบบเหล่านี้กำลังเรียนรู้ด้วยตนเองอย่างสมบูรณ์ เราก็อาจจะสร้างได้ดีขึ้น และระบบปัญญาประดิษฐ์ที่มีความสามารถมากขึ้น
เอเรียล:และริชาร์ด มีอะไรที่คุณอยากจะเพิ่มไหม

สล็อตออนไลน์

Richard:ดังนั้น สิ่งที่น่าตื่นเต้นเป็นพิเศษเกี่ยวกับ AlphaZero คือสามารถทำได้โดยใช้เทคนิคที่คล้ายกับที่ Paul Christiano แห่ง AI Safety เรียกว่า “การขยายความสามารถ” คล้ายกับการเรียนรู้ฟังก์ชันเพื่อคาดการณ์ล่วงหน้าหรือความคาดหวังว่าการเคลื่อนไหวใดจะเกิดขึ้น ณ จุดที่กำหนด รวมทั้งฟังก์ชันในการทำนายว่าผู้เล่นคนใดจะชนะ และมันสามารถทำได้ในลักษณะวนซ้ำ สามารถใช้สิ่งที่เรียกว่า “รูปแบบการขยายเสียง” ในความหมายทั่วไปมากขึ้น ในกรณีนี้คือการค้นหาต้นไม้มอนติคาร์โล แต่ในกรณีทั่วไป อาจเป็นรูปแบบการขยายอื่นที่เหมาะสมกว่าสำหรับการใช้ฟังก์ชันที่เรียบง่ายและวนซ้ำหลายๆ ครั้งเพื่อทำให้แข็งแกร่งขึ้น โดยพื้นฐานแล้วจะมีฟังก์ชันชั้นนำที่สรุปแล้ว
Ariel:ดังนั้นฉันจึงมีคำถามติดตามผลอย่างรวดเร็วที่นี่ ด้วย AlphaZero เป็นโปรแกรมที่อาศัยอยู่ในโลกที่มีกฎเกณฑ์ที่เข้มงวดมาก ขั้นตอนต่อไปในการก้าวออกไปนอกโลกด้วยกฎเกณฑ์ที่เข้มงวดมากและเข้าสู่โลกแห่งความเป็นจริงที่ยุ่งเหยิงมากขึ้นคืออะไร?
เชลซี:เป็นจุดที่ดีจริงๆ สิ่งที่จับได้กับผลลัพธ์เหล่านี้ กับเกมประเภทนี้ และแม้แต่วิดีโอเกมที่ยุ่งยากกว่ากฎที่เข้มงวดของเกมกระดานเล็กน้อย เกมเหล่านี้ เกมเหล่านี้ทั้งหมดสามารถจำลองได้อย่างสมบูรณ์แบบ คุณสามารถจำลองสิ่งที่จะเกิดขึ้นได้อย่างสมบูรณ์แบบเมื่อคุณทำการเคลื่อนไหวบางอย่างหรือเมื่อคุณดำเนินการบางอย่าง ไม่ว่าจะในวิดีโอเกมหรือในเกม Go หรือเกมหมากรุก ฯลฯ ดังนั้น คุณจึงสามารถฝึกระบบเหล่านี้ด้วยข้อมูลที่มีอายุการใช้งานมากมาย
โลกทางกายภาพที่แท้จริงเราไม่สามารถจำลองได้ เราไม่รู้ว่าจะจำลองฟิสิกส์ที่ซับซ้อนของโลกแห่งความเป็นจริงได้อย่างไร ด้วยเหตุนี้ คุณจึงถูกจำกัดด้วยจำนวนหุ่นยนต์ที่คุณมี หากคุณสนใจหุ่นยนต์ หรือหากคุณสนใจด้านการดูแลสุขภาพ คุณจะถูกจำกัดด้วยจำนวนผู้ป่วยที่คุณมี และคุณยังถูกจำกัดด้วยความกังวลด้านความปลอดภัย ต้นทุนของความล้มเหลว และอื่นๆ
ฉันคิดว่าเรายังมีหนทางอีกยาวไกลที่จะก้าวไปสู่ความก้าวหน้าเหล่านี้ในสภาพแวดล้อมจริงที่มีเสียงรบกวนมาก มีความซับซ้อนมากมายในสภาพแวดล้อม และฉันคิดว่าผลลัพธ์เหล่านี้เป็นแรงบันดาลใจ และเราทำได้ แนวคิดบางอย่างจากแนวทางเหล่านี้และนำไปใช้กับระบบประเภทนี้ แต่เราต้องจำไว้ว่ายังมีความท้าทายมากมายรอเราอยู่
Richard:ดังนั้น ระหว่างระบบในโลกแห่งความเป็นจริงและบางอย่างเช่นเกม Go ก็ยังมีการปรับปรุงเพิ่มเติม เช่น การแนะนำพอร์ตนี้สำหรับการสังเกตบางส่วนหรือสภาพแวดล้อมที่สุ่มมากขึ้น หรือสภาพแวดล้อมที่ต่อเนื่องมากกว่าเมื่อเทียบกับระบบที่ไม่ต่อเนื่อง ความท้าทายเหล่านี้ สมมติว่าเรามีสถานการณ์ที่เราสามารถจำลองสิ่งที่เราต้องการเห็นได้จริง หรือใช้การจำลองเพื่อช่วยให้ได้รับข้อมูลการฝึกอบรมได้ทันที ในกรณีเหล่านั้น เราน่าจะทำได้ ความคืบหน้าบางอย่าง โดยใช้เทคนิคแบบนี้กับส่วนขยายบางส่วนหรือปรับเปลี่ยนบางอย่างเพื่อรองรับเกณฑ์เหล่านั้น
เอเรียล:โอเค ตอนนี้ ฉันไม่แน่ใจว่านี่เป็นการก้าวข้ามไปสู่หัวข้อถัดไปโดยธรรมชาติหรือไม่ แต่คุณทั้งคู่ได้กล่าวถึงสิ่งใหญ่ๆ อย่างหนึ่งที่คุณเห็นว่าเกิดขึ้นในปีที่แล้ว คือแนวทางใหม่ที่สร้างสรรค์ในการเรียนรู้แบบไม่มีผู้ดูแล และริชาร์ดใน ส่งอีเมลถึงฉันที่คุณพูดถึง “การแปลคำโดยไม่มีข้อมูลคู่ขนาน” ดังนั้นฉันจึงหวังว่าคุณจะสามารถพูดคุยเพิ่มเติมอีกเล็กน้อยเกี่ยวกับแนวทางสร้างสรรค์ใหม่ๆ เหล่านี้ และสิ่งที่คุณตื่นเต้นเกี่ยวกับที่นั่น
ริชาร์ด:ในปีนี้ เราเห็นการประยุกต์ใช้การเว้นวรรคเวกเตอร์ หรือการฝังคำ ซึ่งโดยพื้นฐานแล้วคือช่องว่างหลายมิติเหล่านี้ ซึ่งมีความสัมพันธ์ระหว่างจุดที่มีความหมายเชิงความหมาย พื้นที่นั้นเรียนรู้โดยเครือข่ายการเรียนรู้เชิงลึกที่ค่อนข้างตื้น แต่ความหมายที่ฝังอยู่ในอวกาศนั้น สามารถใช้ได้จริง ที่เราได้เห็นในปีนี้ โดยการใช้ภาษาต่างๆ หรือฉันควรบอกว่าช่องว่างเวกเตอร์นั้น ได้รับการฝึกฝนในภาษาต่างๆ หรือสร้างขึ้นจาก corpora ของภาษาต่างๆ และเปรียบเทียบ และด้วยเทคนิคบางอย่างเพื่อจัดเรียงเปรียบเทียบและหาเหตุผลเข้าข้างตนเองในความแตกต่างระหว่างช่องว่างเหล่านั้น เราสามารถแปลคำและแปลสิ่งต่าง ๆ ระหว่างคู่ภาษาในลักษณะที่จริง ๆ แล้ว ในบางกรณี, เกินแนวทางภายใต้การดูแลเพราะโดยทั่วไปแล้วจะมีชุดเอกสารคู่ขนานที่มีความหมายเหมือนกันในภาษาต่างๆ แต่ในกรณีนี้ เราสามารถทำสิ่งที่คล้ายกับสิ่งที่นักแปลสากล Star Trek ทำ การใช้ภาษาต่างด้าวหรือภาษาต่างประเทศอย่างเพียงพอ ฉันสามารถจำลองความสัมพันธ์ระหว่างแนวคิดต่างๆ แล้วปรับแนวความคิดเหล่านั้นด้วยแนวคิดที่เป็นที่รู้จัก

jumboslot

เชลซี คุณต้องการที่จะแสดงความคิดเห็นเกี่ยวกับเรื่องนี้หรือไม่?
เชลซี:ผมคิดว่าผมไม่มีอะไรจะเพิ่มเติมมากเกินไป ฉันตื่นเต้นกับผลการแปลด้วย และฉันก็เคยเห็นงานที่คล้ายคลึงกันด้วย เดาเอาว่า งานที่กำลังมองหาการเรียนรู้แบบไม่มีผู้ดูแล ไม่ใช่เพื่อการแปล ที่มีความคล้ายคลึงกันเล็กน้อย แต่ค่อนข้างจะเป็นเรื่องทางเทคนิค ของแนวทางที่แท้จริง
Ariel:ใช่ ฉันสงสัยว่าคุณคนใดคนหนึ่งอยากจะลองอธิบายว่ามันทำงานอย่างไรโดยไม่พูดถึงช่องว่างเวกเตอร์?
ริชาร์ด:นั่นเป็นเรื่องยากเพราะเป็นพื้นที่ ฉันหมายความว่ามันเป็นแนวคิดทางเรขาคณิต และเป็นเพราะเรากำลังจัดแนวรูปร่างภายในพื้นที่นั้น เราจึงทำให้เกิดเวทมนตร์ได้
เอเรียล:งั้นจะเหมือนกับว่าคุณมีภาษาต่างๆ เข้ามา เอกสารบางประเภทหรือเอกสารต่างๆ จากภาษาต่างๆ ที่เข้ามา และโปรแกรมนี้ก็แค่จับคู่พวกมันลงในช่องว่างนี้ เพื่อจะได้รู้ว่าคำไหนคู่ควรกับคำแต่ละคำ อื่น ๆ แล้ว?
ริชาร์ด:อืม มันเข้าใจความสัมพันธ์ระหว่างคำและรูปร่างของความสัมพันธ์ในโลก มันสามารถนำรูปร่างเหล่านั้นและหมุนให้เป็นแบบที่เข้ากันได้
เชลซี:ใช่ บางทีมันอาจจะเป็นประโยชน์ถ้ายกตัวอย่าง ฉันคิดว่าโดยทั่วไปในภาษาที่คุณพยายามจะข้ามแนวความคิด และมีโครงสร้างภายในภาษา ฉันหมายความว่ามีโครงสร้างที่คุณเรียนรู้ในชั้นประถมศึกษาเมื่อคุณเรียนรู้คำศัพท์ คุณเรียนรู้เกี่ยวกับกริยา คุณเรียนรู้เกี่ยวกับคำนาม คุณเรียนรู้เกี่ยวกับผู้คน และเรียนรู้คำศัพท์ต่างๆ ที่อธิบายสิ่งต่าง ๆ เหล่านี้ และภาษาต่างๆ ได้แบ่งปันโครงสร้างประเภทนี้ในแง่ของสิ่งที่พวกเขาพยายามจะสื่อสาร
ดังนั้น สิ่งที่อัลกอริธึมเหล่านี้ทำคือ ให้ข้อมูลโดยทั่วไปของคนที่พูดภาษาอังกฤษ หรือคนที่เขียนเอกสารเป็นภาษาอังกฤษ และพวกเขายังได้รับข้อมูลในภาษาอื่นด้วย และอันแรกไม่จำเป็นต้องเป็นภาษาอังกฤษ พวกเขาได้รับข้อมูลในภาษาหนึ่งและข้อมูลในอีกภาษาหนึ่ง ข้อมูลนี้ไม่ตรงกัน ไม่ใช่เอกสารฉบับหนึ่งที่แปลเป็นอีกฉบับหนึ่ง เป็นเพียงชิ้นส่วนของภาษา เอกสาร บทสนทนา และอื่นๆ โดยใช้โครงสร้างที่มีอยู่และข้อมูลเช่น คำนาม กริยา สัตว์ คน ก็สามารถเข้าใจได้โดยทั่วไป วิธีทำแผนที่จากโครงสร้างของภาษาหนึ่งไปยังโครงสร้างของภาษาอื่น มันสามารถรับรู้โครงสร้างที่คล้ายกันนี้ในทั้งสองภาษา จากนั้นจึงหาแผนที่จากที่หนึ่งไปอีกที่หนึ่ง
เอเรียล:โอเค ดังนั้น ฉันคิดว่า ฉันต้องการก้าวไปข้างหน้า แต่ยังคงเรียนรู้ตามแนวคิด และเชลซี ฉันต้องการอยู่กับคุณสักครู่ คุณบอกว่ามีความก้าวหน้าด้านโลหะหนักที่เกิดขึ้นในปีที่แล้ว และคุณยังพูดถึงการประชุมเชิงปฏิบัติการและการประชุมสัมมนาที่ NIPS ฉันสงสัยว่าคุณจะพูดมากกว่านี้ได้ไหม
Chelsea:ใช่ ฉันคิดว่ามีความตื่นเต้นมากมายเกี่ยวกับการหาเงินหรือการเรียนรู้ที่จะเรียนรู้ มีการประชุมสองครั้งที่ NIPS การประชุมสัมมนาหนึ่งครั้ง การประชุมเชิงปฏิบัติการหนึ่งครั้งในปีนี้ และทั้งคู่ก็มีผู้เข้าร่วมจำนวนมาก อันที่จริงแล้ว Metalearning มีประวัติที่ค่อนข้างยาวนาน ดังนั้นจึงไม่ใช่หัวข้อล่าสุดหรือหัวข้อใหม่ แต่ฉันคิดว่ามันได้กลับมาให้ความสนใจอีกครั้งในชุมชนแมชชีนเลิร์นนิง
[NPC5]ดังนั้น ฉันเดาว่าฉันสามารถอธิบายรายได้โลหะได้ โดยพื้นฐานแล้วจะมีระบบที่เรียนรู้วิธีเรียนรู้ มีแอพพลิเคชั่นมากมายสำหรับระบบดังกล่าว หนึ่งในนั้นคือแอปพลิเคชันที่มักเรียกกันว่า AutoML หรือการเรียนรู้ของเครื่องอัตโนมัติ ซึ่งระบบเหล่านี้สามารถเพิ่มประสิทธิภาพพารามิเตอร์ไฮเปอร์ โดยพื้นฐานแล้วหาชุดพารามิเตอร์ที่ดีที่สุด แล้วรันอัลกอริธึมการเรียนรู้ด้วยชุดพารามิเตอร์ไฮเปอร์เหล่านั้น ประเภทของงานของนักวิจัยแมชชีนเลิร์นนิงที่ปรับแต่งโมเดลต่างๆ ในชุดข้อมูลที่แตกต่างกัน และโดยพื้นฐานแล้วสิ่งนี้สามารถช่วยให้ผู้คนฝึกฝนโมเดลบนชุดข้อมูลได้ง่ายขึ้น