การชนะคอมพิวเตอร์ไม่ได้อยู่ในไพ่สำหรับมือโปรโป๊กเกอร์

การชนะคอมพิวเตอร์ไม่ได้อยู่ในไพ่สำหรับมือโปรโป๊กเกอร์

ในการประลองปัญญาระหว่างมนุษย์และเครื่องจักร คอมพิวเตอร์ได้เพิ่มค่าแอนทีโปรแกรมเล่นโป๊กเกอร์ใหม่สองโปรแกรมสามารถเป็นผู้เชี่ยวชาญที่ดีที่สุดได้ที่ Texas Hold’em แบบไม่จำกัด ซึ่งเป็นเวอร์ชันสำหรับผู้เล่นสองคนโดยไม่มีข้อจำกัดเกี่ยวกับขนาดของการเดิมพัน เป็นอีกเกมหนึ่งในรายการเกมที่ซับซ้อนเพิ่มขึ้นเรื่อยๆ เช่น หมากรุก หมากฮอส ( SN: 7/21/07, หน้า 36 ) และ Go ( SN: 12/24/16, หน้า 28 ) ซึ่งคอมพิวเตอร์มีอำนาจสูงสุด

นักวิทยาศาสตร์คอมพิวเตอร์จากมหาวิทยาลัยอัลเบอร์ตาในแคนาดา

รายงานว่าโปรแกรมของพวกเขาที่รู้จักกันในชื่อ DeepStack ได้เอาชนะผู้เล่นโป๊กเกอร์มืออาชีพอย่างรอบด้าน โดยเล่น 3,000 มือต่อแต่ละคน โปรแกรมไม่ได้ชนะทุกมือ — บางครั้งโชคจากการจับฉลากก็ขัดกับมัน แต่หลังจากการนับผลแล้ว DeepStack สามารถเอาชนะฉลามการ์ดได้ 10 จาก 11 ตัวนักวิทยาศาสตร์รายงานออนไลน์ในวันที่ 2 มีนาคมในScience (DeepStack ก็เอาชนะผู้แข่งขันคนที่ 11 ได้เช่นกัน แต่ชัยชนะนั้นไม่มีนัยสำคัญทางสถิติ)

“งานนี้น่าประทับใจมาก” นักวิทยาศาสตร์คอมพิวเตอร์ Murray Campbell หนึ่งในผู้สร้าง Deep Blue คอมพิวเตอร์ที่เอาชนะ Garry Kasparov ปรมาจารย์หมากรุกในปี 1997 DeepStack “มีกำไรมหาศาล” Campbell จาก Thomas J ของ IBM กล่าว . ศูนย์วิจัยวัตสันในยอร์กทาวน์ไฮทส์ นิวยอร์ก  

ในทำนองเดียวกัน นักวิทยาศาสตร์คอมพิวเตอร์ที่นำโดย Tuomas Sandholm จาก Carnegie Mellon University ใน Pittsburgh เพิ่งเอาชนะผู้เล่น Texas Hold’em ระดับหัวกะทิ 4 คน ได้โดยไม่มีข้อจำกัดด้วยโปรแกรมที่เรียกว่า Libratus ผู้เข้าแข่งขันแต่ละคนเล่น 30,000 มือกับโปรแกรมระหว่างการแข่งขันที่จัดขึ้นในเดือนมกราคมที่ Pittsburgh Libratus นั้น “แข็งแกร่งกว่ามนุษย์ทุกคนที่ฉันเคยเล่น” Jason Les มืออาชีพด้านโป๊กเกอร์กล่าว

ก่อนหน้านี้ Michael Bowling — หนึ่งในผู้สร้างของ DeepStack

 — และเพื่อนร่วมงานได้สร้างโปรแกรมที่สามารถเล่นโป๊กเกอร์แบบสองคนได้ ซึ่งขนาดของการเดิมพันมีจำกัด โปรแกรมนั้นเล่นเกมได้เกือบสมบูรณ์แบบ: สถิตินี้ไม่มีใครสามารถเอาชนะได้ภายในช่วงชีวิตหนึ่งของมนุษย์ ( SN: 2/7/15, p. 14 ) แต่โป๊กเกอร์แบบไม่จำกัดนั้นซับซ้อนกว่าอย่างมาก เนื่องจากเมื่ออนุญาตให้วางเดิมพันได้ทุกขนาด จะมีการดำเนินการที่เป็นไปได้อีกมากมาย ผู้เล่นต้องตัดสินใจว่าจะทุ่มทั้งหมด เล่นอย่างปลอดภัยด้วยเงินเดิมพันเล็กน้อย หรือเดิมพันบางอย่างระหว่างนั้น “เท็กซัส โฮลเด็มแบบไม่มีขีดจำกัด … อันที่จริงแล้วซับซ้อนกว่าหมากรุกมาก” แคมป์เบลล์กล่าว

ในเกมไพ่ ผู้เล่นแต่ละคนจะได้รับไพ่สองใบคว่ำหน้า และผู้เล่นทั้งสองแบ่งปันไพ่ห้าใบที่หงายหน้า โดยมีการเดิมพันรอบระหว่างขั้นตอนของการแจกไพ่ ต่างจากหมากรุกหรือ Go ที่ผู้เล่นทั้งสองสามารถเห็นชิ้นส่วนทั้งหมดบนกระดาน ในโป๊กเกอร์ ข้อมูลบางอย่างถูกซ่อนไว้ — ไพ่สองใบในมือของผู้เล่นแต่ละคน เกมดังกล่าวเรียกว่าเกมข้อมูลไม่สมบูรณ์นั้นยากเป็นพิเศษสำหรับคอมพิวเตอร์ที่จะเชี่ยวชาญ

ในการขัดเกลาเทคนิคของ DeepStack นักวิจัยได้ใช้การเรียนรู้เชิงลึก ซึ่งเป็นวิธีการของการเรียนรู้ด้วยเครื่องซึ่งกำหนดความรู้สึกเหมือนสัญชาตญาณว่าเมื่อใดควรจับและพับเมื่อใด เมื่อถึงตาของโปรแกรม โปรแกรมจะจัดเรียงตัวเลือกสำหรับการดำเนินการสองสามอย่างถัดไปและตัดสินใจว่าจะทำอย่างไร ผลที่ได้คือ ธรรมชาติของ DeepStack “ดูเหมือนมนุษย์มากกว่า” โบว์ลิ่งกล่าว

Libratus คำนวณกลยุทธ์สำหรับเกมล่วงหน้าและอัปเดตตัวเองในขณะที่เล่นเพื่อแก้ไขข้อบกพร่องในยุทธวิธีที่ฝ่ายตรงข้ามได้เปิดเผย เมื่อใกล้สิ้นสุดเกม Libratus จะเปลี่ยนไปใช้การคำนวณตามเวลาจริง ซึ่งในระหว่างนั้นจะมีการปรับปรุงวิธีการเพิ่มเติม Libratus มีความต้องการด้านการคำนวณมากจนต้องใช้ซูเปอร์คอมพิวเตอร์ในการทำงาน (DeepStack สามารถทำงานบนแล็ปท็อปได้)

การสอนคอมพิวเตอร์ให้เล่นเกมที่มีข้อมูลที่ซ่อนอยู่ เช่น โป๊กเกอร์ อาจนำไปสู่การใช้งานจริงได้ในที่สุด “เกมข้อมูลที่ไม่สมบูรณ์แบบทั้งหมดเป็นขั้นตอนหนึ่งที่นำไปสู่ความยุ่งเหยิงในโลกแห่งความเป็นจริง” แคมป์เบลล์กล่าว คอมพิวเตอร์ที่สามารถจัดการกับความยุ่งเหยิงนั้นสามารถช่วยในการเจรจาธุรกิจหรือการประมูล และสามารถช่วยป้องกันความเสี่ยงที่ซ่อนอยู่ในความปลอดภัยทางไซเบอร์เป็นต้น

credit : sandpointcommunityradio.com sanfordriverwalk.org sarongpartyfrens.com secondladies.net sekacka.info