AI: ผู้ช่วยหุ่นยนต์จะขโมยงานของคุณหรือไม่?
การสนทนาเกี่ยวกับปัญญาประดิษฐ์กระตุ้นให้เกิดปฏิกิริยาที่ตื่นเต้นและน่าสะพรึงกลัวเท่ากัน ความตื่นเต้นเนื่องจากประสิทธิภาพการประหยัดต้นทุนที่อาจเกิดขึ้นกับ AI น่ากลัวเพราะการกล่าวถึงระบบอัตโนมัติจะทำให้เกิดความกลัวต่อความซ้ำซ้อนและการใช้งานไม่ได้ในหมู่คนงานที่มีทักษะปานกลางและมีทักษะต่ำ
ในการจัดการภาครัฐ การสนทนาเกี่ยวกับแอปพลิเคชันการเรียนรู้ของเครื่องไม่แตกต่างกัน ตัวอย่างเช่น เมื่อต้นปีนี้ Deloitte และ University of Oxford ได้ตีพิมพ์งานวิจัยที่เสนอแนะว่างานภาครัฐในสหราชอาณาจักรมากถึง 10% จะเป็นการทำงานอัตโนมัติภายในปี 2030 หากการลงทุนด้านเทคโนโลยีต่ำ จะช่วยประหยัดชั่วโมงแรงงานของรัฐบาลได้มากถึง 4% และขึ้นไปถึง 31% หากการลงทุนว่าการลงทุนสูง ท่ามกลางการคาดคะเนในแง่ดีนี้ กลับเป็นภัยคุกคามต่อการลดจำนวนข้าราชการจำนวนมาก และในระยะยาว ความเหลื่อมล้ำก็เพิ่มมากขึ้น
แม้ว่าความกลัวเหล่านี้ แต่ปัญญาประดิษฐ์จะยังคงอยู่
รัฐบาลต้องตัดสินใจว่าจะจัดการการหยุดชะงักของข้าราชการพลเรือนอย่างไรให้ดีที่สุดซึ่งเป็นส่วนหนึ่งของการรวมปัญญาประดิษฐ์เข้ากับการจัดการภาครัฐ หากได้รับการจัดการอย่างถูกต้อง AI ไม่เพียงแต่เพิ่มประสิทธิภาพการบริการสาธารณะเท่านั้น แต่ยังสามารถจินตนาการถึงบทบาทของข้าราชการในขณะที่ผลักดันพวกเขาไปสู่งานที่เกี่ยวข้องกับความคิดสร้างสรรค์และการแก้ปัญหาที่เข้มงวด ปัญญาประดิษฐ์อาจมีประสิทธิภาพสูงสุดหากใช้เพื่อเพิ่มงานของมนุษย์แทนที่จะแทนที่มนุษย์
เราเพียงแค่ต้องดูหมากรุกที่ใช้คอมพิวเตอร์ช่วย (โดยทั่วไปเรียกว่า Advanced Chess) เพื่อดูระดับการเล่นที่ไม่เคยมีมาก่อนทั้งในหมากรุกของมนุษย์และหมากรุกคอมพิวเตอร์ ปัญญาประดิษฐ์จึงสามารถช่วยเหลือข้าราชการได้โดยเฉพาะเมื่อปฏิบัติงานที่มีความซับซ้อนน้อยกว่า เช่น งานต่างๆ เช่น การประมวลผลเอกสารการย้ายถิ่น หรือการจัดการการตรวจจับการฉ้อโกงและการตรวจสอบการปฏิบัติตามในโครงการสาธารณะ ส่งผลให้ข้าราชการมีส่วนร่วมในงานสร้างสรรค์มากขึ้น ปรับปรุงคุณภาพการให้บริการสาธารณะอย่างมหาศาล
ความกังวลที่มักเกิดขึ้นกับภาพสีดอกกุหลาบของการทำงานร่วมกันระหว่างมนุษย์กับคอมพิวเตอร์นั้นเกี่ยวข้องกับลักษณะการทวีคูณของการพัฒนาความสามารถของ AI หากปัญญาประดิษฐ์สามารถทำงานที่ต้องใช้วิจารณญาณอย่างง่าย อะไรจะหยุดระบบเหล่านี้ไม่ให้พัฒนาความซับซ้อนในที่สุด ทำให้พวกเขาทำงานที่ต้องใช้ความคิดสร้างสรรค์และทักษะในการแก้ปัญหาได้ ลองนึกภาพรัฐบาลระดับ 5ที่ปกครองตนเองโดยสมบูรณ์ – การคำนวณสำหรับภาครัฐโดยตรงจากนวนิยายของ JG Ballard
แม้ว่าจะเป็นเรื่องที่น่ากังวลอยู่ไม่ไกล แต่ความกลัวต่อความซ้ำซ้อนอย่างสมบูรณ์ของมนุษย์ในระบบอัจฉริยะทำให้เข้าใจผิดในการกำกับดูแลโดยใช้ AI แมชชีนเลิร์นนิงเกิดขึ้นผ่านการเรียนรู้ภายใต้การดูแล การเรียนรู้แบบไม่มีผู้ดูแล และการเรียนรู้ที่ได้รับการเสริมกำลัง กระบวนการทั้งหมดเหล่านี้ต้องการการกำกับดูแลของผู้ปกครองของข้าราชการพลเรือนสามัญเพื่อสร้างชุดข้อมูลการฝึกอบรมสำหรับเทคโนโลยี เพื่อกำหนดวาระในการกำหนดนโยบาย ติดตามการตัดสินใจ และที่สำคัญต้องทบทวนในกรณีที่การตัดสินใจด้วยอัลกอริทึมล้มเหลว
ในที่สุดมันก็ขึ้นอยู่กับรัฐบาลที่จะควบคุม AI ให้ดีขึ้นในการบริการสาธารณะและการพัฒนาข้าราชการ สิ่งนี้จำเป็นอย่างยิ่งที่รัฐบาลจะต้องสร้างสรรค์สิ่งใหม่ ๆ จากสถานที่แห่งอำนาจมากกว่าความกลัว แทนที่การเล่าเรื่องของความซ้ำซ้อนและการแทนที่ด้วยการเสริมและการเพิ่มประสิทธิภาพ
มีช่วงเวลาที่เป็นครูหรือผู้อำนวยความสะดวกที่อารมณ์ในห้องเปลี่ยนไปอย่างกะทันหัน บางครั้งนี่คือจุดเริ่มต้นของหายนะ: อ่านห้องผิด เลือกตัวอย่างที่มีความหมายซ่อนเร้น หรือเพียงแค่สูญเสียความไว้วางใจ แต่ในบางครั้ง เมื่อมีคนแสดงบางอย่างเกี่ยวกับตัวเอง ซึ่งเป็นของจริง และทั้งห้องหันไปหาพวกเขา นี่เป็นช่วงเวลาที่ฉันโปรดปราน เมื่อต้นเดือนนี้ การฝึกอบรมกลุ่มข้าราชการที่มีพรสวรรค์ในยูเครน ห้องนี้หันไปหาผู้เข้าร่วมที่พูดคุยเกี่ยวกับพระเจ้า
พระเจ้าดูเหมือนเป็นข้อมูลอ้างอิงที่ไม่น่าจะเป็นไปได้ในการประชุมเชิงปฏิบัติการสามวันเกี่ยวกับการนำข้อมูลแบบเปิดไปใช้ แต่เมื่อฉันขอให้กลุ่มพูดคุยเกี่ยวกับแรงบันดาลใจของพวกเขา เราเปลี่ยนจากการสนทนาทางเทคโนโลยีไปชั่วขณะหนึ่ง และเริ่มพูดถึงแรงผลักดันที่ลึกซึ้งยิ่งขึ้น แรงบันดาลใจบางส่วนที่อ้างถึงคือเรื่องศาสนา: หลักปฏิบัติในการดำรงชีวิตซึ่งนำไปใช้กับการทำงานเช่นกัน หรือคุณลักษณะที่ผู้นำศาสนาชื่นชมซึ่งเจ้าหน้าที่ต้องการนำมาสู่ความเป็นผู้นำของตนเอง แรงบันดาลใจอื่น ๆ เป็นเรื่องโลกาภิวัตน์มากขึ้น แต่ก็ไม่น้อยไปกว่าเรื่องส่วนตัว เจ้าหน้าที่พูดถึงพ่อแม่ของพวกเขา เจ้านายที่เชื่อในตัวพวกเขา หรืออีลอน มัสก์ วินสตัน เชอร์ชิลล์ หรือลี กวน ยู ที่ได้รับความชื่นชมจากคนไกลที่สุด
การสนทนาแบบนี้ให้ความรู้สึกที่แตกต่างกันมากสำหรับข้าราชการซึ่งมักถูกฝึกให้คิดวิเคราะห์ บางทีนี่อาจเป็นเหตุผลว่าทำไมในห้องนี้ถึงมีความรุนแรง เมื่อผู้คนเริ่มพูดอย่างตรงไปตรงมาว่าทำไมพวกเขาถึงทำในสิ่งที่พวกเขาทำ คำถามที่ลึกซึ้งเหล่านี้มีความสำคัญสำหรับเจ้าหน้าที่ ในฐานะผู้มีบทบาทในสถาบัน และในฐานะประชาชน
ข้าราชการเป็นนักแสดงของรัฐบาล และประชาชนมีความคาดหวังทางศีลธรรมต่อรัฐบาลของตน รัฐบาลที่ไร้ความสามารถนั้นน่าหงุดหงิด รัฐบาลที่ไม่เป็นธรรมเป็นสิ่งที่น่ากลัว รัฐบาลแต่ละแห่งมีโครงสร้าง อนุสัญญา และกฎเกณฑ์ที่ซับซ้อนซึ่งชี้นำการกระทำของตน แต่ความรู้สึกผิดชอบชั่วดีของเจ้าหน้าที่ของรัฐเป็นหนึ่งในพลังอำนาจในการชี้นำทางศีลธรรมที่ทรงพลังที่สุด
มิติส่วนบุคคลก็มีความสำคัญเช่นกัน เป็นเวลากว่าสามปีที่ฉันได้ให้คำแนะนำแก่ข้าราชการในการดำเนินการเปลี่ยนแปลงทางดิจิทัลในรัฐบาล ข้าราชการเหล่านั้นทำงานหนักซึ่งต้องใช้ความอดทนและแรงผลักดัน แนวทางสร้างสรรค์และความเข้มงวดในการวิเคราะห์ ฉวยโอกาสและกรวด เช่นเดียวกับใครก็ตามที่เป็นผู้นำการเปลี่ยนแปลง การเปลี่ยนแปลงทางดิจิทัลอาจเป็นงานที่โดดเดี่ยวเช่นกัน Richard Pope พูดคุยอย่างไตร่ตรองที่นี่กับเพื่อนร่วมงานที่น่าสงสัยและประชาชนที่ไม่เชื่อ ในยูเครน ความคิดเห็นของประชาชนในระดับต่ำของรัฐบาลทำให้เรื่องนี้ยากขึ้น
เมื่องานยาก มันช่วยให้รู้ว่าทำไมคุณถึงทำ เหตุผลหนึ่งที่ฉันชอบทำงานและสำหรับรัฐบาล ก็คือฉันใส่ใจจริงๆ ว่ารัฐบาลจะทำงานได้ดี มันช่วยได้ในวันที่ฉันรู้สึกท้อแท้ เหนื่อย หรือถูกประเมินค่าต่ำไป เมื่อเครื่องจักรขนาดใหญ่มีความสำคัญและเพราะฉันรู้สึกว่ามันสำคัญ มันจะเป็นฟันเฟืองในนั้นง่ายกว่า (และเป็นฟันเฟืองที่ขยันและเอาใจใส่) ความเชื่อมโยงทางอารมณ์ ความเชื่อในความสำคัญของการปกครอง เป็นแรงผลักดันทางศีลธรรมสำหรับฉัน และมีความยืดหยุ่นมากกว่าการวิเคราะห์ที่พิสูจน์ว่ารัฐบาลมีความสำคัญ
การให้การสนับสนุนแก่ผู้นำในรัฐบาลที่พวกเขาต้องการหมายถึงการช่วยให้พวกเขาคิดอย่างมีศีลธรรมและวิเคราะห์ เราทุกคนจำเป็นต้องได้รับการเตือนในบางครั้งว่าทำไมเราถึงทำในสิ่งที่เราทำ เหตุใดจึงสำคัญ และทำไมเราควรดำเนินต่อไป ฉันคิดว่าย้อนกลับไปที่ Lord Gus O’Donnell บอกกลุ่มข้าราชการของออสเตรเลียว่าแรงจูงใจทางศีลธรรมประเภทนี้ง่ายกว่าสำหรับรัฐบาลมากกว่าในภาคเอกชน และเราควรใช้มันให้มากกว่านี้
เมื่อความไว้วางใจทั่วโลกในรัฐบาลต่ำและแม้แต่ความชอบธรรมของรัฐบาลก็รู้สึกว่าถูกคุกคาม เราควรช่วยข้าราชการในการสร้างและปกป้องความเชื่อมั่นทางศีลธรรมของพวกเขาเกี่ยวกับสาเหตุที่พวกเขาทำงานให้กับรัฐบาล มันเสริมความแข็งแกร่งให้กับพวกเขาจากความคับข้องใจของพวกเขาและมันเสริมความแข็งแกร่งให้กับพลังทางศีลธรรมของรัฐบาล นี่คือเหตุผลที่ Oxford Insights ให้ความสำคัญกับความเป็นผู้นำ ไม่ใช่แค่เทคโนโลยี ตามที่เจ้าหน้าที่คนหนึ่งให้ความเห็นเมื่อสิ้นสุดการประชุมเชิงปฏิบัติการของเราในยูเครน: “ฉันไม่ได้เป็นเพียงการนำโปรแกรมไปใช้ ฉันกำลังเปลี่ยนแผนกของฉัน”
ฉันสังเกตเห็นว่าความท้าทายอย่างหนึ่งที่ผู้คนเผชิญเมื่อพูดถึงปัญญาประดิษฐ์ในรัฐบาลคือภาษาที่จะใช้ AI เป็นคำที่กว้างมากซึ่งครอบคลุมทุกอย่างตั้งแต่การเรียนรู้ของเครื่องจนถึงปัญญาทั่วไป ผู้คนอาจมัวแต่คิดหาวิธีออกแบบระบบที่สมบูรณ์แบบเพื่อจัดการกับปัญหาที่เราจะไม่เผชิญอีกหลายปี ฉันกำลังคิดว่ากรอบงานทั่วไปจะมีลักษณะอย่างไรเพื่อทำให้ชัดเจนขึ้นว่าเราหมายถึงอะไรเมื่อเราพูดถึง AI
ชัยชนะครั้งใหญ่สำหรับภาครัฐกำลังก้าวไปไกลกว่าการทำตามกฎด้วยการท่องจำข้อเท็จจริงที่ว่าขณะนี้เครื่องจักรสามารถใช้วิจารณญาณได้ แม้ว่าเราจะยังอยู่ในช่วงเริ่มต้น แต่เราสามารถเห็นระดับความซับซ้อนต่างๆ เกิดขึ้นได้
ในรถยนต์ที่ขับด้วยตนเอง ระดับต่อไปนี้ได้รับการยอมรับจากอุตสาหกรรม (การถอดความเป็นของฉัน):
ระดับ 0 – ไม่มีระบบอัตโนมัติ – คุณทำงานทั้งหมด นี่คือรถยนต์ส่วนใหญ่
ระดับ 1 – การเสริมคนขับ – คุณทำงานส่วนใหญ่ แต่เช่น รถอาจมีความเร็วปานกลาง
ระดับ 2 – การดูแลอย่างใกล้ชิด – ผู้ขับขี่สามารถเอามือและเท้าออกจากตัวควบคุมได้ แต่ต้องพร้อมที่จะกระโดดเข้าไป
ระดับ 3 – กึ่งอัตโนมัติ – รถสามารถเข้าควบคุมการตรวจสอบตามปกติเพื่อให้ผู้ขับขี่ผ่อนคลายจนกว่าจะได้รับการแจ้งเตือน
ระดับ 4 – ระบบอัตโนมัติ – รถขับเองได้ เว้นแต่จะอยู่ในสถานการณ์ที่ ‘รุนแรง’ เช่น ถนนลูกรังระดับ 5 – ระบบอัตโนมัติเต็มรูปแบบ – รถยนต์มีประสิทธิภาพเหนือกว่าผู้คนแม้ในสภาพแวดล้อมที่ ‘สุดขั้ว’
สำหรับบริบทปัจจุบัน Tesla อยู่ที่ระดับ 2.5 (แม้ว่าจะเป็นทางการในระดับ 2) และบริษัทต่างๆ อย่าง Ford ก็ตั้งเป้าไปที่ระดับ 4 ระดับ 4 คือสิ่งที่Oxboticaจะทำการทดสอบในปีหน้าเมื่อพวกเขาใช้รถยนต์จำนวนมากระหว่างอ็อกซ์ฟอร์ดและลอนดอน
เรื่องราวของการปฏิรูปภาครัฐเป็นหนึ่งในคำมั่นสัญญาที่ยิ่งใหญ่ การลงทุนครั้งใหญ่ ความตั้งใจดี และผลลัพธ์ที่น่าผิดหวังบ่อยครั้ง ในช่วง 40 ปีที่ผ่านมา เราได้เห็นแรงผลักดันอย่างมหาศาลในด้านประสิทธิภาพ ตั้งแต่การศึกษาครั้งแรกและการเคลื่อนไหวในยุค 70 การทบทวนประสิทธิภาพในยุค 80 การจัดการสาธารณะรูปแบบใหม่ในยุค 90 ประสิทธิภาพการดำเนินงานในยุค 2000 และการเปลี่ยนแปลงทางดิจิทัลในปัจจุบันในปี 2010 แต่ละคนต่างพยายามดิ้นรนเพื่อตระหนักถึงศักยภาพสูงสุดที่สัญญาไว้ เนื่องจากการบริการสาธารณะนั้นยากต่อการลดกฎเกณฑ์ง่ายๆ ชีวิตมีความซับซ้อนและช่วยเหลือผู้คนเมื่อพวกเขาต้องการความช่วยเหลือมากที่สุดต้องใช้วิจารณญาณที่ดีและความเข้าใจที่ซับซ้อนเกี่ยวกับวิธีการแยกสาเหตุและผล จัดการความคาดหวังในหมู่ประชาชน และทำให้การเมืองภายในรัฐบาลถูกต้อง
ศักยภาพของปัญญาประดิษฐ์มาจากความสามารถในการจัดการกับความซับซ้อนของชีวิตจริง ข้อเสนอนี้เป็นจุดเริ่มต้นของโปรแกรมคอมพิวเตอร์ที่สามารถตัดสินได้ แทนที่จะทำตามกฎที่ตั้งไว้ล่วงหน้า
โปรแกรมทั่วไปรับอินพุตที่ได้รับ ตามกระบวนการที่ออกแบบ และจบลงด้วยผลลัพธ์ที่สมองของมนุษย์ประเมินเพื่อช่วยในการตัดสินใจสร้างผลลัพธ์บางอย่าง ความก้าวหน้าล่าสุดของปัญญาประดิษฐ์ทำให้สมองของมนุษย์สามารถกำหนดผลลัพธ์ที่ต้องการ และปล่อยให้ส่วนที่เหลืออยู่ในโปรแกรมคอมพิวเตอร์ จากนั้นโปรแกรมสามารถคำนวณปัจจัยการผลิตที่ต้องการ กระบวนการที่ต้องการติดตาม ผลลัพธ์ที่เป็นประโยชน์ และวิธีการใช้ปัจจัยเหล่านี้ในการตัดสินใจ
การพูดคุยในปัจจุบันเกี่ยวกับ AI มุ่งเน้นไปที่การเรียนรู้ด้วยเครื่อง – วิธีที่เครื่องจะบรรลุผลลัพธ์ได้ดีที่สุดจะทำงานซ้ำแล้วซ้ำอีกโดยเครื่องในขณะที่เรียนรู้ ในขณะที่เทคนิคเหล่านี้ยังอยู่ในช่วงเริ่มต้นในการบริการสาธารณะ เทคโนโลยีพื้นฐานกำลังก้าวหน้าอย่างรวดเร็ว เช่น การใช้เพื่อระบุมะเร็งในสถานพยาบาล อย่างไรก็ตาม ตัวอย่างที่โดดเด่นที่สุดคือรถยนต์ที่ขับด้วยตนเอง เช่น วิดีโอนี้แสดงให้เห็นว่าระบบของเทสลาระบุความเสี่ยงในแบบเรียลไทม์ได้อย่างไร:
สิ่งนี้แสดงให้เห็นว่าเทคโนโลยีนี้สามารถสัมผัสได้ถึงความซับซ้อน และยังให้ข้อมูลเชิงลึกว่ารถมี ‘ความคิด’ อย่างไร รถจะเลือกคุณลักษณะต่างๆ พยายามจัดประเภทแล้วตอบสนองตามนั้น เมื่อมันพบกับวัตถุใหม่หรือสถานการณ์ใหม่ มันจะเรียนรู้จากวิธีที่มันจัดการกับมันมาก่อน – เรียนรู้จากความผิดพลาดของมัน
เหนือสิ่งอื่นใด ข้อกำหนดทั่วไปสำหรับการเปลี่ยนแปลงในภาครัฐแมชชีนเลิร์นนิงต้องการบางสิ่งจึงจะมีประสิทธิภาพ (และต้องขอบคุณการปฏิรูป e-government ก่อนหน้าที่ภาครัฐให้บริการกับพวกเขา):
ผลลัพธ์ที่กำหนด – เพื่อให้เครื่องรู้ว่ามันประสบความสำเร็จหรือไม่ (นี่คือเหตุผลหนึ่งว่าทำไมการทดสอบ Deepmind ในช่วงต้นจึงเกิดขึ้นกับเกมคอมพิวเตอร์ )
โครงสร้างพื้นฐานข้อมูลที่แข็งแกร่ง – จึงมีข้อมูลที่เครื่องสามารถทำงานได้
ปริมาณธุรกรรมมาก – เพื่อให้มีตัวอย่างมากมายให้เรียนรู้และทดลอง
[NPC4]ความเป็นไปได้เหล่านี้ทำให้เกิดคำถามที่สำคัญมากมาย: เกี่ยวกับสถานที่ที่ดีที่สุดในการทดลองใช้ปัญญาประดิษฐ์ในรัฐบาล เกี่ยวกับจริยธรรมและความรับผิดชอบของการตัดสินใจทางคอมพิวเตอร์ เกี่ยวกับอนาคตของงาน เกี่ยวกับความปลอดภัยและกระบวนการประชาธิปไตย เกี่ยวกับบทบาทของพลเรือน การบริการและประเภทของผู้นำที่เราต้องการ เป็นต้น Oxford Insights ตั้งตารอที่จะเผยแพร่คำถามเหล่านี้และอื่น ๆ ในอีกไม่กี่เดือนข้างหน้า
Oxford Insights ถามคำถาม: หากคุณอุทิศเวลาหนึ่งสัปดาห์ในการเรียนรู้ปัญญาประดิษฐ์ คุณควรใช้เวลานั้นอย่างไร
เพื่อตอบคำถามนั้น Laura Caccia นักวิจัยของเราได้จัดทำหลักสูตรเร่งรัดระยะเวลาหนึ่งสัปดาห์เพื่อให้คุณได้รับทราบเกี่ยวกับการพัฒนาขั้นพื้นฐานและการโต้วาทีที่กำหนดขอบเขตของปัญญาประดิษฐ์: วิธีการทำงาน เหตุใดจึงสำคัญ และสิ่งที่สามารถทำได้ สำหรับคุณ. เราได้แนะนำหนังสือสองเล่มที่มีราคารวม 20 ปอนด์ และเอกสารอื่นๆ ที่เหลือก็หาอ่านได้ฟรีทางออนไลน์
Dactylเป็นระบบ AI ที่สามารถจัดการวัตถุด้วยมือหุ่นยนต์ที่เหมือนมนุษย์ OpenAI Fiveเป็นระบบ AI ที่สามารถเอาชนะมนุษย์ได้ในวิดีโอเกม Dota 2 สิ่งที่แปลกคือพวกเขาทั้งคู่ได้รับการพัฒนาโดยใช้อัลกอริธึมการเรียนรู้การเสริมแรงเพื่อวัตถุประสงค์ทั่วไปเดียวกัน
เป็นไปได้อย่างไรและแสดงให้เห็นอย่างไร?
แจ็ค คลาร์ก ผู้อำนวยการนโยบายของ OpenAI ให้สัมภาษณ์ในวันนี้ อธิบายว่าจากมุมมองด้านคอมพิวเตอร์โดยใช้มือและการเล่น Dota 2 เป็นปัญหาที่คล้ายคลึงกันอย่างมาก
มือหุ่นยนต์ต้องจับวัตถุ ขยับนิ้ว และหมุนไปยังตำแหน่งที่ต้องการ ใน Dota 2 คุณควบคุมทีมที่มีผู้คนหลากหลาย เคลื่อนพวกเขาไปรอบ ๆ แผนที่เพื่อโจมตีศัตรู
มือของคุณมีข้อต่อ 20 หรือ 30 ข้อให้เคลื่อนไหว จำนวนการกระทำหลักใน Dota 2 คือ 10 ถึง 20 เมื่อคุณย้ายตัวละครไปรอบๆ แผนที่
เมื่อคุณหมุนวัตถุในมือ คุณจะสัมผัสได้ถึงแรงเสียดทาน แต่คุณไม่ได้รับรู้ถึงรูปร่างทั้งหมดของวัตถุโดยตรง ใน Dota 2 คุณไม่สามารถมองเห็นทั้งแผนที่และรับรู้ถึงสิ่งที่อยู่ที่นั่นด้วยการเคลื่อนที่ไปรอบๆ — เปรียบเสมือน ‘สัมผัส’ พื้นที่
นี่เป็นความจริงของปัญหาที่แตกต่างกันอย่างเห็นได้ชัดในชีวิต การบีบอัดข้อมูลเข้าทางประสาทสัมผัสต่างๆ ลงไปจนถึงปัญหาการคำนวณพื้นฐาน ซึ่งเราทราบวิธีแก้ปัญหาต้องใช้ซอฟต์แวร์สำหรับวัตถุประสงค์ทั่วไปเท่านั้น
OpenAI ใช้อัลกอริธึมที่เรียกว่า Proximal Policy Optimization (PPO) ซึ่งค่อนข้างแข็งแกร่ง ในแง่ที่ว่าคุณสามารถโยนมันทิ้งไปในปัญหาต่างๆ มากมาย ไม่ต้องกังวลกับการปรับแต่งมากเกินไป และมันจะไม่เป็นไร
[NPC5]Jack เน้นย้ำว่าอัลกอริทึมนี้สร้างได้ไม่ง่าย และพวกเขารู้สึกตื่นเต้นอย่างมากที่จะได้ทำงานทั้งสองอย่าง แต่เขายังกล่าวอีกว่าการสร้างอัลกอริธึม ‘สเปกตรัมกว้าง’ ที่เพิ่มขึ้นนั้นเป็นเรื่องราวในช่วงไม่กี่ปีที่ผ่านมา และการประดิษฐ์ซอฟต์แวร์อย่าง PPO จะมีผลกระทบที่คาดเดาไม่ได้ ทำให้เกิดความท้าทายอย่างมากในนโยบาย AI