Newsletter subscribe

Artificial Intelligence, Innovation

จริงหรือไม่ที่ Google กำลังสร้าง AI ให้กลายเป็น Skynet#10 AlphaGo

Posted: 09/09/2020 at 13:57   /   by   /   comments (0)

Chinook เป็นโปรแกรมคอมพิวเตอร์แรกที่เอาชนะมนุษย์ที่เป็นแชมเปี้ยนโลกในการแข่งขันเกมของมนุษย์  Chinook ถูกพัฒนาโดยนักวิจัยของมหาวิทยาลัย Alberta ประเทศแคนาดา เมื่อปี 1992 เพื่อการเล่นเกมหมากฮอส (Checkers)

Chinook แข่งขันเล่นเกมหมากฮอสครั้งแรกกับ Mario Tinsley แชมเปี้ยนโลก ใน ปี 1992 ซึ่ง Tinsley เอาชนะ Chinook ด้วยคะแนน 4-2 ต่อมาทั้งคู่มาแข่งขันกันอีกครั้งในนัดล้างตา เมื่อปี 1994 มันเป็นการแข่งขันเกมหมากฮอส เพื่อชิงแชมเปี้ยนโลกระหว่างมนุษย์กับเครื่องจักร เมื่อการแข่งขันผ่านไป 6 เกม Tinsley ขอถอนตัวเนื่องจากเป็นมะเร็งตับอ่อน และ Chinook ได้รับการประกาศให้เป็นแชมเปี้ยนโลกของเกมหมากฮอส ถึงแม้นว่ามันจะไม่เคยเอาชนะมนุษย์ที่เป็นผู้เล่นเกมหมากฮอสที่ดีที่สุดตลอดกาลอย่าง Tinsley แต่มันก็ได้รับการบันทึกในประวัติศาสตร์ว่าเป็น “คอมพิวเตอร์ตัวแรกที่เอาชนะแชมเปี้ยนโลกที่เป็นมนุษย์” ได้

อย่างไรก็ตามความรู้ความสามารถทั้งหมดของ Chinook มาจากการเขียนโปรแกรมของผู้สร้าง ไม่เหมือนกับการเรียนรู้ของ Artificial Intelligence หรือ AI

 

หน้าตาของ Deep Blue (wikipedia.org)

Deep Blue เป็นโปรแกรมคอมพิวเตอร์พัฒนาโดย IBM สำหรับการเล่นเกมหมากรุก (Chess) และเป็น Artificial Intelligence หรือ AI ตัวแรกที่สามารถเอาชนะมนุษย์ที่เป็นผู้เล่นหมากรุกระดับแชมเปี้ยนโลก Garry Kasparov ชาวรัสเซีย

 

การแข่งขันระหว่าง Garry Kasparov กับ AI “Deep Blue”  (pbs.org)

การแข่งขันระหว่าง Deep Blue กับ Garry Kasparov เริ่มขึ้นในปี 1996 โดย Garry แชมป์หมากรุกโลกในตอนนั้น เอาชนะ Deep Blue ไปด้วยคะแนน 4-2 แต่หลังจากนั้นอีกหนึ่งปี ในปี 1997 IBM พา Deep Blue เวอร์ชั่นปรับปรุงใหม่ (heavily upgraded) กลับมาแก้มือกับ Garry อีกครั้ง และในศึกแก้มือครั้งนี้ เป็นการแข่งกัน 6 เกม Deep Blue เป็นฝ่ายเอาชนะ Garry ไปด้วยคะแนน ชนะ 2 แพ้ 1 และเสมอ 3 เกม

แต่หลังจากจบการแข่งขัน Garry Kasparov กล่าวหาว่า IBMโกง และต้องการให้แข่งขันอีกรอบ แต่ IBM ปฏิเสธและปลดระวาง Deep Blue

สาเหตุที่ Garry Kasparov กล่าวหาว่า IBM โกง คือ บางครั้งเขาเห็นการเดินหมากของ Deep Blue ชาญฉลาดและสร้างสรรค์เป็นอย่างมาก เขาคิดว่ามีผู้เล่นหมากรุกที่เป็นคนเข้ามาแทรกแซงการทำงานของ Deep Blue ในระหว่างการแข่งขันซึ่งถือว่าขัดต่อกติกา แต่ IBM ปฏิเสธข้อกล่าวหานั้นและกล่าวว่าการแทรกแซงโดยคนจะเกิดขึ้นได้ในช่วงก่อนเกมหรือหลังเกมเท่านั้น กติกาอนุญาตให้โปรแกรมเมอร์สามารถแก้ไขโปรแกรมหลังเกมแต่ละเกมได้เพื่อแก้ไขจุดอ่อนที่ปรากฏขึ้นในเกม กติกานี้ช่วยให้ Deep Blue ไม่พลาดท่าให้กับจุดอ่อนที่เกิดขึ้นในเกมก่อนหน้า 

 

wikipedia.org

การเล่นกระดานหมากล้อมโกะ (Go) เกิดขึ้นในประเทศจีนเมื่อ 2,500 ปีก่อน นิยมเล่นกันมากในเอเชียตะวันออก เช่น จีน เกาหลีใต้ และญี่ปุ่น

กฎของเกมนั้นง่ายมาก: ผู้เล่นคนหนึ่งใช้หมากสีดำ อีกคนใช้หมากสีขาว ในตอนเริ่มของเกม กระดานจะว่างเปล่า ผู้เล่นจะผลัดกันวางหมากของตัวเองบนกระดาน พยายามยึดครองพื้นที่ว่างเพื่อทำแต้ม และ key ของกลยุทธในการเล่น คือ พยายามควบคุมหมากของฝ่ายตรงข้าม โดยการวางหมากของตัวเองล้อมรอบหมากของคู่แข่งทุกทิศทุกทางอย่างสมบูรณ์ หมากที่โดนล้อมรอบจะถูกพิจารณาว่าถูกจับและถูกนำออกจากกระดาน การต่อสู้ที่ซับซ้อนระหว่างหมากสีดำและสีขาว ครอบคลุมพื้นที่ตั้งแต่มุมจนถึงศูนย์กลางของกระดาน

ถึงกฎของเกมส์ง่าย แต่การเล่นหมากล้อม Go นั้นถือเป็นเกมส์ที่มีความซับซ้อนอย่างยิ่ง การเล่น Go นั้นมีแนวทางที่เป็นไปได้ในการเดินหมากถึง 3 พันล้านแนวทาง (ข้อมูลจาก British Go Association) โดยหลักการแล้ว การเล่น Go ผู้เล่นจะเล่นตามสัญชาตญาณและความรู้สึก มันเป็นเกมที่มีความสวยงาม ความละเอียดอ่อน ใช้ความลึกของสติปัญญา และจินตนาการของมนุษย์

จากคุณสมบัติที่พิเศษของหมากล้อม Go ที่กล่าวมา สร้างความสนใจสำหรับ Google DeepMind เกมคลาสสิกอย่างหมากล้อมถือเป็นสิ่งท้าทายที่สุดสำหรับปัญญาประดิษฐ์ หรือ Artificial intelligence (AI)

 

alamy.com

Demis Hassabis ซึ่งเป็น CEO ของ Google DeepMind ได้พูดถึงการเล่นหมากล้อม Go ว่า

“Go เป็นเกมที่ใช้สัญชาตญาณมากกว่าการคำนวณอย่างง่ายๆเหมือนหมากรุก Go เป็นเกมที่สวยงามที่สุดที่มนุษย์ประดิษฐ์ขึ้นมา มันมี “ความซับซ้อนที่ลึกซึ้ง” มีตำแหน่งของ Go ที่เป็นไปได้มากกว่าจำนวนอะตอมในจักรวาล” 

สิ่งที่ท้าทายของหมากล้อม Go สำหรับ AI มี 3 สิ่ง คือ พื้นที่การค้นหาจำนวนมหาศาล (enormous search space), ความยากในการประเมินตำแหน่งและการเดินหมากบนกระดาน

 

 

Linkin Park – Iridescent

 

 

AlphaGo ถูกจัดให้เป็นโปรแกรมคอมพิวเตอร์ที่มีความซับซ้อนที่สุดในโลก และได้รับการยกย่องให้เป็น “Holy grail (จอกศักดิ์สิทธิ์) of AI” พัฒนาโดย Google DeepMind ซึ่งมีสำนักงานใหญ่ในกรุงลอนดอน ประเทศอังกฤษ เมื่อเดือนตุลาคม 2015 โดย AlphaGo เป็น AI ตัวแรกที่เอาชนะมนุษย์ที่เป็นผู้เล่นหมากล้อม Go ระดับมืออาชีพของโลก

AlphaGo มีหลายเวอร์ชั่น ได้แก่ AlphaGo, AlphaGo Master, AlphaGo Zero และ AlphaZero 

 

 

นี้คือหน้าตาของ AlphaGo ซึ่งใช้พลังในการประมวลสูงมาก นี่เป็นสาเหตุต้องใช้คอมพิวเตอร์จำนวนมากในการทำงานของ AlphaGo ดังภาพข้างบน (tastehit.com) 

 

AlphaGo เป็น AI ที่ทำงานโดยการผสมผสานการเรียนรู้ 3 แบบ คือ Neural network,  Monte Carlo Search Tree (MCTS) และ Reinforcement Learning 

 

becominghuman.ai

Artificial Neural Network เรียกสั้นๆว่า Neural network (โครงข่ายประสาทเทียม) ซึ่งทำงานแบบเดียวกับสมองมนุษย์ ได้รับการฝึกฝนโดยการป้อนข้อมูลการเล่นเกมของนักเล่นหมากล้อม Go ระดับมืออาชีพจำนวนมหาศาลให้มันเรียนรู้

Neural network (โครงข่ายประสาทเทียม) ของ AlphaGo มี 2 แบบ คือ Policy network ใช้เลือกการเดินหมาก และ Value network ใช้ประเมินตำแหน่งบนกระดานหมาก

 

salika.co

Monte Carlo Search Tree (MCTS) เป็นกลยุทธ์ที่ทำให้ AlphaGo ประสบความสำเร็จในการเล่นหมากล้อม Go โดย MCTS เป็นเทคนิคที่ถูกใช้ในการสร้าง AI เพื่อเล่นเกมหมากล้อม Go ด้วยการคำนวณความเป็นไปได้ทั้งหมด แล้วให้คอมพิวเตอร์ทำการอ่านเกมล่วงหน้า เพื่อ “เลือกการเดินหมากต่อไปที่ดีที่สุด” (the most promising next move)

MCTS  ที่ถูกออกแบบให้ AlphaGo ใช้นั้นเป็นแบบ Pure MCTS คือ AlphaGo ไม่ได้ใช้การเรียนรู้จากประสบการณ์ในการเล่นเกมที่ผ่านๆมา แต่มันจะเริ่มต้นการเรียนรู้ที่จุดเริ่มต้นของเกมใหม่แต่ละเกม มันพัฒนาตัวเองในระหว่างการเล่นเกม

ถ้าใช้ MCTS แบบปกติที่ใช้กัน ซึ่งใช้การเรียนรู้จากประสบการณ์จากการเล่นเกมที่ผ่านๆมา  AlphaGo จะไม่สามารถเอาชนะนักเล่น Go ระดับโลกได้ (ข้อมูลจาก scientificamerican.com)

 

 

youtube.com

Reinforcement Learning หรือการเรียนรู้แบบเสริมกำลัง Neural network (โครงข่ายประสาทเทียม) เรียนรู้เพื่อพัฒนาตัวเอง จากการเล่นเกมกับตัวมันเอง (self-play)

หนึ่งในทีมงานของโครงการ AlphaGo ได้สรุปการทำงานของ AlphaGo ให้ฟังอย่างง่ายๆว่า “โปรแกรมคอมพิวเตอร์ AlphaGo นี้ จริงๆแล้ว มันเรียนรู้การเล่นเกมโดยอาศัยความช่วยเหลือจากมนุษย์ไม่มากนัก เราป้อนข้อมูลการแข่งขันกระดานหมากล้อม Go ของผู้เล่นมืออาชีพจำนวน 100,000 การแข่งขันให้มันเรียนรู้ เพื่อช่วยมันพัฒนาความเข้าใจของมันเอง ว่าทำไมมนุษย์ถึงมีเหตุผลที่เล่นอย่างนี้ จากนั้นเราให้มันเล่นแข่งกับเวอร์ชั่นที่แตกต่างกันของตัวมันเองหลายล้านครั้ง แต่ละครั้งมันจะเรียนรู้จากความผิดพลาดของมันเพื่อพัฒนาตัวเองขึ้นเรื่อยๆ จนกระทั่งมันแข็งแกร่งขึ้นอย่างมาก” 

 

techmoblog.com

AlphaGo ได้แข่งกับผู้เล่นหมากล้อม Go ระดับมืออาชีพครั้งแรก เมื่อเดือนตุลาคม 2015 โดยเล่นแข่งกับ Fan Hui  ซึ่งเป็นแชมเปี้ยนหมากล้อม Go จากรายการแข่งขันของยุโรป Alpha Go เอาชนะด้วยคะแนน 5-0 แต่การแข่งขันอย่างไม่เป็นทางการนี้ ไม่ได้ถูกเปิดเผยต่อสาธารณะ จนกระทั่งวรสาร “Nature” ฉบับเดือนมกราคม 2016 ตีพิมพ์บทความเกี่ยวกับ AlphaGo 

 

becominghuman.ai 

ต่อมาในเดือนมีนาคม 2016 ที่ประเทศเกาหลีใต้ AlphaGo ซึ่งเป็นเวอร์ชั่นปรับปรุงใหม่จากเวอร์ชั่นที่เคยแข่งกับ Hui เมื่อ 6 เดือนที่ก่อน ทำการแข่งขันกับ Lee Sedol แชมเปี้ยนโลกชาวเกาหลีใต้วัย 33 ปี ผู้ซึ่งถูกจัดให้เป็นหนึ่งในผู้เล่นหมากล้อม Go ที่แข็งแกร่งที่สุดในโลก เขาเคยเป็นแชมเปี้ยนโลกถึง 18 ครั้งตลอดระยะเวลา 21 ปีของการเล่น Go ของเขา 

 

Engadget.com

ภาพบนเวทีการประชุมก่อนการแข่งขัน ประกอบด้วย Demis Hassabis,  CEO ของ Google DeepMind (ซ้าย),  Lee Sedol ผู้แข่งขัน (กลาง) และ Eric Schmidt ผู้บริหารสูงสุดหรือประธานบอร์ดในขณะนั้นของ Alphabet บริษัทแม่ของ Google (ขวา)

ในการแข่งขันครั้งประวัติศาสตร์ “Match of the Century” ระหว่างมนุษย์กับ AI ครั้งนี้ มีผู้ชม on-line มากกว่า 100 ล้านคนจากทั่วโลก ในจำนวนนี้มีผู้ชม 60 ล้านคนอยู่ในประเทศจีน เงินรางวัลสำหรับผู้ชนะคือ 1 ล้านเหรียญสหรัฐ ซึ่ง Demis Hassabis ได้กล่าวก่อนเริ่มการแข่งขันว่า ถ้า AlphaGo ชนะ ก็จะบริจาคเงินรางวัลทั้งหมดให้กับการกุศล

 

en.people.cn

ภาพการแข่งขัน Lee Sedol นั่งอยู่ทางขวา และ Aja Huang หัวหน้าโปรแกรมเมอร์ของ Google DeepMind นั่งอยู่ทางซ้าย

การแข่งขันเกมหมากล้อมครั้งนี้มีทั้งหมด 5 เกม ใช้เวลาในการแข่งขัน 7 วัน จบลงด้วยการที่ AlphaGo เอาชนะ Lee Sedol ไป 4-1 เกม AlphaGo ชนะใน 3 เกมแรก

สำหรับ Lee Sedol นั้นถึงกับช็อคเมื่อแพ้ให้กับ AlphaGo ในเกมแรก และกล่าวหลังการแข่งขันว่า

“ผมไม่เคยคิดเลยว่าผมจะแพ้ และไม่เคยคิดเลยว่า AlphaGo จะสามารถเล่นได้อย่างสมบูรณ์แบบ และผมรู้สึกประหลาดใจมากที่ AlphaGo ทำการเดินหมาก ในแนวทางที่เป็นไปไม่ได้เลยสำหรับมนุษย์ที่จะเลือกเดินแบบนั้น”

อย่างไรก็ตาม Lee สามารถเอาชนะในเกมที่ 4 แต่ AlphaGo กลับมาเป็นฝ่ายชนะในเกมสุดท้าย (หลังจากสติแตกไปพักหนึ่ง 555)

ชัยชนะครั้งแรกของ Lee Sedol ต่อ AlphaGo ในเกมที่ 4 ทำให้บอกได้ว่า AI ไม่ได้เหนือกว่ามนุษย์อย่างสมบูรณ์แบบในการเล่น Go และชี้ให้เห็นว่า AlphaGo ยังมีส่วนที่ต้องปรับปรุงอีก เกมที่ 4 นี้ถือได้ว่าเป็นเกมสุดท้ายที่มนุษย์สามารถเอาชนะเครื่องจักรได้ 

 

 

cbc.ca

เกมการแข่งขันครั้งนี้ Lee Sedol เต็มไปด้วยอารมณ์และความรู้สึก Lee เล่นด้วยความเครียดและเหนื่อยล้า หลังการประกาศผลการแข่งขัน Lee ยังคงนั่งอยู่ที่เก้าอี้และหลั่งน้ำตา

 

koreabizwire.com

ในการประชุมหลังจบการแข่งขัน Lee ได้พูดบรรยายความรู้สึกว่า “ผมพลาด ผมเสียใจที่เกมจบลงอย่างนี้” แต่ถึงกระนั้น Lee เปลี่ยนมามีรอยยิ้มเมื่อเขากล่าวว่า “เกมหนึ่งเกมที่ผมชนะ เป็นสิ่งที่มีค่าสำหรับผมมาก ไม่สามารถมีสิ่งใดมาแลกกับสิ่งนี้ได้” 

 

newscientist.com

การแข่งขันนี้ทำให้ AlphaGo ได้รับการคัดเลือกให้เป็นหนึ่งในความก้าวหน้าทางวิทยาศาสตร์แห่งปี 2016 จากวรสาร “Science” 

 

 

Shawn Mendes – Stitches

หนุ่มคนนี้โดนสิ่งที่ไม่มีตัวตน (ghost?) ไล่ถลุง พ่ายแพ้ยับเยินเลย แต่ออร่ายังกระจายนะ ตัวเอง 

 

 

ต่อมา Google DeepMind ได้ปล่อย AlphaGo เวอร์ชั่นปรับปรุงใหม่ เข้าไปแฝงตัวเล่นเกมออนไลน์ของหมากล้อม Go กับมนุษย์ที่เป็นผู้เล่นมืออาชีพจากทั่วโลก บนเซิร์ฟเวอร์ Tygem ของเกาหลีใต้ ซึ่งเป็นเว็บไซต์ที่เป็นที่นิยมของนักเล่นหมากล้อม Go โดยครั้งแรกเข้าไปเล่นภายใต้ account name ‘Magister’เมื่อวันที่ 29 ธันวาคม 2016 และได้มีการเปลี่ยน account name มาเป็น ‘Master’ เมื่อวันที่ 30 ธันวาคม 2016 และหลังจากที่ ‘Master’ เล่นชนะคู่แข่ง 30 เกมรวด ได้ย้ายไปเล่นบนเซิร์ฟเวอร์ FoxGo เมื่อวันที่ 1 มกราคม 2017

Master เอาชนะบรรดามือโปรระดับโลกจากหลายประเทศตั้งแต่ จีน ญี่ปุ่น เกาหลีใต้ รวมทั้ง Ke Jie ชาวจีน วัย 19 ปี มือวางอันดับหนึ่งของโลก ความเก่งกาจของ Master ถึงขนาดทำให้ กูลี่ มือวางอันดับสี่ของโลกชาวจีน ซึ่งพ่ายแพ้ Master มา ได้เสนอเงิน 1,000 หยวน (14,400 ดอลลาร์สหรัฐ) ให้แก่ผู้เล่นคนแรกที่สามารถเอาชนะ Master ได้

ผู้ที่เฝ้าดูการเล่นเกมออนไลน์นี้พากันสงสัยว่า Master เป็นใคร บางคนสงสัยว่าเป็นคนที่ใช้โปรแกรมคอมพิวเตอร์ช่วยเหลือในการเล่น  Master เล่น 10 เกมต่อวัน หลายคนเริ่มสงสัยว่าเป็นผู้เล่น AI เนื่องจาก Master ไม่มีการหยุดพักหรือพักน้อยมากในระหว่างการเล่นเกม หลังชนะไป 59 เกม  Master ก็เปิดเผยตัวเองในห้องสนทนาออนไลน์ (chatroom) ว่า “I’m Dr. Huang of AlphaGo” ซึ่ง Dr. Aja Huang เป็นผู้เชี่ยวชาญ AI ชาวไต้หวัน และเป็นทีมงานคนหนึ่งของโครงการ AlphaGo ของ Google DeepMind และเคยเป็นผู้นั่งวางหมากให้กับ AlphaGo ในการแข่งขันกับ Lee Sedol 

 

 

 จนกระทั่งวันที่ 4 มกราคม 2017 หลังจากที่ Master ชนะ 60 เกมรวดแล้ว ไม่แพ้เลยสักเกม ในเวลาต่อมา “Demis Hassabis” ซึ่งเป็น CEO ของ Google DeepMind และเป็นหนึ่งในทีมนักวิจัยของโครงการ AlphaGo ได้ออกมายืนยันผ่านทาง Twitter ว่า ทั้ง Magiste และ Master เป็น “AlphaGo Master” ซึ่งเป็นเวอร์ชั่นปรับปรุงใหม่ของ AlphaGo ที่เคยเอาชนะ Lee Sedol ไปเมื่อปีที่แล้วนั่นเอง

และ Demis Hassabis ยังได้กล่าวว่า

“ตอนนี้การทดสอบแบบไม่เป็นทางการเสร็จสิ้นแล้ว เรากำลังมองหาการเล่นในระดับที่เป็นทางการ และมีระยะเวลาในการเล่นแบบเต็มที่ ที่จัดการแข่งขันโดยความร่วมมือขององค์กรและผู้เชี่ยวชาญของวงการหมากล้อม Go”

 

themomentum.co

บรรดาผู้เล่นมืออาชีพของเกมหมากล้อม Go ต่างรู้สึกประทับใจอย่างยิ่งกับผลงานการเล่นและรูปแบบการเล่นที่ไม่เหมือนมนุษย์เล่น ของ AlphaGo

Ke Jie ผู้เล่นมือวางอันดับหนึ่งของโลกชาวจีน ผู้ซึ่งเคยประกาศว่า “AlphaGo สามารถเอาชนะ Lee Sedol แต่มันจะไม่สามารถเอาชนะผมได้”

หลังจากที่พ่ายแพ้ให้กับ AlphaGo แบบหมดรูป และทราบว่า Master คือ Alphago ที่เขาเคยสบประมาท Ke Jie ได้เขียน on-line ว่า

” หลังจากที่มนุษยชาติใช้เวลาหลายพันปีในการปรับปรุงกลยุทธ์ของเรา คอมพิวเตอร์บอกเราว่ามนุษย์ผิดทั้งหมด ผมบอกได้เลยว่า ไม่ใช่มนุษย์เท่านั้นแล้ว ที่สัมผัสความจริงของกระดานหมากล้อม Go”  

 

 

chinauncensored.tv

ต่อมาที่ในเดือนพฤษภาคม 2017 ภายในงานการประชุมสุดยอดหมากล้อม Go แห่งอนาคต 2017 (Future of Go Summit 2017) ที่จัดขึ้นในประเทศจีน AlphaGo ได้แข่งขันเกมหมากล้อมกับ Ke Jie ชาวจีน วัย 19 ปี มือวางอันดับหนึ่งของโลก จากสมาคมหมากล้อม Go ของจีน เกาหลีใต้ และญี่ปุ่น

Ke Jie นั้นเคยพ่ายแพ้ให้กับ AlphaGo Master มาแล้วใน 60 on-line games เมื่อเดือนมกราคม 2017 ในปีเดียวกันนี้

Google DeepMind แจ้งก่อนการแข่งขันว่า เวอร์ชั่นของ AlphaGo ที่เล่นในการแข่งขันนี้ เป็น AlphaGo Master ที่เคยปราบบรรดาเซียนหมากล้อม Go (รวมทั้ง Ke Jie ) ใน 60 online games เมื่อเดือนมกราคม 2017 แต่ความจริงแล้ว มันได้กลายเป็น “AlphaGo Zero” ไปเรียบร้อยแล้ว ซึ่งเป็นเวอร์ชั่นที่มีความแข็งแกร่งกว่า AlphaGo Master มาก ความจริงของเรื่องนี้เพิ่งมาเปิดเผยในเดือนตุลาคม 2017 เมื่อ “Nature” ซึ่งเป็นวรสารในวงการวิทยาศาสตร์ ได้ลงบทความเกี่ยวกับ AlphaGo Zero ซึ่งถูกส่งมาจากนักวิจัยของ Google DeepMind

ย้อนกลับมาที่การแข่งขันหมากล้อมระหว่าง “AlphaGo Zero” กับ Ke Jie  เป็นการแข่งขัน 3 เกม ผลการแข่งขัน AlphaGo Zero เอาชนะ Ke Jie ไปด้วยคะแนน 3-0 

 

 

youtube.com

และเช่นเดียวกับ Lee Sedol หลังพ่ายแพ้ให้กับ AlphaGo Zero, Ke Jie ถึงกับหลั่งน้ำตาด้วยความเสียใจ

 

 

medium.com

Ke Jie ได้กล่าวหลังจบการแข่งขันว่า ” เมื่อปีที่แล้ว ผมคิดว่ามันเล่นได้ใกล้เคียงกับมนุษย์มาก แต่ปีนี้ผมคิดว่า มันเล่นได้เหมือน “พระเจ้าแห่ง Go” มาก”

 

 

salika.co

Google DeepMind สร้าง AI “AlphaGo Zero” ที่สอนตัวเองให้กลายเป็นผู้เล่นเกมหมากล้อม Go ที่แข็งแกร่งที่สุดในโลก

Google DeepMind กล่าวว่า AlphaGo Zero เป็นโปรแกรมคอมพิวเตอร์ที่ทรงพลังที่สุดเท่าที่เคยสร้างมา มีความสามารถเหนือมนุษย์ มันพัฒนาตัวเองโดยไม่ต้องพึ่งความรู้ของมนุษย์ ซึ่งแตกต่างจากเวอร์ชั่นที่ผ่านๆ ที่เรียนรู้จากข้อมูลการเล่นของมนุษย์ที่ถูกป้อนให้ และเสริมการเรียนรู้ด้วยการเล่นกับตัวมันเอง แต่สำหรับ AlphaGo Zero นั้น ข้ามขั้นตอนของการป้อนข้อมูลของมนุษย์ให้เรียนรู้  เหลือเพียงแค่การเรียนรู้จาก “การเล่นกับตัวเอง (self-play)”

 

ในภาพ starting from scratch คือ ทำด้วยตัวเองมาตั้งแต่ต้น (analyticsindiamag.com)

ในตอนเริ่มเกม มันจะเล่นแบบสะเปะสะปะ (completely random play) มันรู้เพียงแค่กฎของเกม นอกนั้นมันไม่รู้อะไรเลยเกี่ยวกับเกมหมากล้อม Go  เนื่องจากมันไม่ได้รับการป้อนข้อมูลการเล่นของมนุษย์ให้เรียนรู้ (นี้จึงเป็นที่มาของคำว่า “Zero”)  มันเรียนรู้เกมจากการเล่นกับตัวมันเอง (self-play) ภายในเวลา 24 ชั่วโมง มันก็สามารถพัฒนาตัวเองจากที่ไม่รู้อะไรเลยให้กลายเป็นผู้เล่นหมากล้อม Go ที่มีความสามารถในระดับที่เหนือกว่ามนุษย์

Google DeepMind ได้เปิดเผยถึงความเก่งขั้นเทพของ AlphaGo Zero ว่าทีมงานให้มันลองแข่งกับเวอร์ชั่นที่ผ่านๆมาของมัน ผลปรากฎว่า AlphaGo Zero ใช้เวลา 1.5 วันในการเรียนรู้พัฒนาตัวเองจนอยู่ในระดับเดียวกับ Alpha Go เวอร์ชั่นที่แข่งกับ Lee Sedol และสามารถเอาชนะ AlphaGo (Lee) ภายในระยะเวลา 3 วัน ด้วยคะแนน 100-0 และใช้เวลา 40 วันในการพัฒนาตัวเองและเอาชนะ AlphaGo Master เวอร์ชั่นที่แข่งเกมออนไลน์ 60 เกม ด้วยคะแนน 89-11  

 

“มันเป็นก้าวที่ยิ่งใหญ่ของเราในการสร้างโปรแกรมคอมพิวเตอร์เพื่อการใช้งานทั่วไป (General- purpose AI)  AI ส่วนใหญ่ถูกออกแบบมาเพื่อการใช้งานประเภทเดียว (Single-purpose AI) เช่น การแปลภาษา หรือ การระบุใบหน้า แต่ General-purpose AI มีศักยภาพดีกว่ามนุษย์ มันสามารถทำงานที่แตกต่างกันหลายๆงาน  ใน 10 ปีข้างหน้า ผมเชื่อว่าลูกหลานของ AlphaGo/AlphaGo Zero จะทำงานเคียงข้างมนุษย์ในฐานะผู้เชี่ยวชาญทางวิทยาศาสตร์ หรือ ทางการแพทย์ มันจะช่วยแก้ปัญหาใหญ่ๆของโลกได้ในอนาคต”

 

smithsonianmag.com

เวอร์ชั่นล่าสุดของ AlphaGo คือ “AlphaZero”  ซึ่งถูกพัฒนาแตกต่างจาก AlphaGo Zero เพราะมันสามารถเล่นได้ทั้งเกมหมากล้อม Go, หมากรุก Chess และหมากญี่ปุ่น Shogi  ซึ่ง Google DeepMind ได้เปิดตัว AlphaZero เมื่อเดือนธันวาคม 2017

– AlphaZero เคยแข่งขันเกมหมากรุก กับ Stockfish ซึ่งเป็นโปรแกรมคอมพิวเตอร์ที่มีดีกรีเป็นแชมเปี้ยนโลกของการแข่งขันเกมหมากรุกปี 2016 สร้างโดยกลุ่มนักวิจัยชาวยุโรป

AlphaZero ใช้เวลาในการเรียนรู้เกมหมากรุก 9 ชั่วโมงก่อนการแข่งขัน ผลคือ AlphaZero เป็นฝ่ายชนะ

– AlphaZero ยังได้เคยแข่งขันเกมหมาก Shogi กับ Elmo ซึ่งเป็นโปรแกรมคอมพิวเตอร์ที่มีดีกรีเป็นแชมเปี้ยนโลกของการแข่งขันเกมหมาก Shogi ปี 2017

AlphaZero ใช้เวลาในการเรียนรู้เกมหมาก Shogi เพียง 2 ชั่วโมงก่อนการแข่งขัน ผลคือ AlphaZero เป็นฝ่ายชนะ

– AlphaZero ได้เล่นเกมหมากล้อม Go กับ AlphaGo Zero ใช้เวลาในการเรียนรู้เกมด้วยตัวเอง 34 ชั่วโมง ผลคือ AlphaZero เอาชนะ 60 เกม แพ้ 40 เกม