AlphaGo làm chủ trò chơi cờ vây cổ xưa, đánh bại nhà vô địch cờ vây thế giới và truyền cảm hứng cho một kỷ nguyên mới của hệ thống AI. Cùng Cao Thủ Cờ khám phá lục đẳng cờ vây và AlphaGo trong bài viết dưới đây nhé!
Alpha Go Là Ai?
Tạo nên lịch sử
Hệ thống trí tuệ nhân tạo (AI) của chúng tôi, AlphaGo, đã học cách thành thạo trò chơi cờ vây cổ xưa của Trung Quốc – một trò chơi cờ cực kỳ phức tạp về chiến lược, tính sáng tạo và sự khéo léo.
AlphaGo đã đánh bại một nhà vô địch cờ vây thế giới là con người một thập kỷ trước khi các chuyên gia nghĩ là có thể, truyền cảm hứng cho người chơi trên khắp thế giới khám phá những phương pháp tiếp cận mới và được cho là đã trở thành kỳ thủ cờ vây mạnh nhất trong lịch sử.
Nó chứng minh rằng các hệ thống AI có thể học cách giải quyết những vấn đề khó khăn nhất trong các lĩnh vực có độ phức tạp cao.
Các thách thức
Cờ vây từ lâu đã được coi là một thách thức lớn đối với AI. Trò chơi này phức tạp hơn cờ vua gấp nhiều lần – với sức mạnh đáng kinh ngạc là 10 mũ 170 cấu hình bàn cờ có thể có. Con số này nhiều hơn số lượng nguyên tử trong vũ trụ đã biết.
Các chương trình máy tính cờ vây mạnh nhất chỉ đạt được mức độ nghiệp dư của con người, mặc dù đã có hàng thập kỷ làm việc. Các phương pháp AI tiêu chuẩn gặp khó khăn trong việc đánh giá số lượng nước đi có thể thực hiện được và thiếu tính sáng tạo cũng như trực giác của người chơi.
Cách tiếp cận của chúng ta
Chúng tôi đã tạo ra AlphaGo, một hệ thống AI kết hợp mạng lưới thần kinh sâu với các thuật toán tìm kiếm nâng cao.
Một mạng lưới thần kinh – được gọi là “mạng chính sách” – chọn nước đi tiếp theo để chơi. Mạng nơ-ron còn lại – “mạng giá trị” – dự đoán người chiến thắng trong trò chơi.
Ban đầu, chúng tôi đã giới thiệu AlphaGo cho nhiều trò chơi cờ vây nghiệp dư để hệ thống có thể tìm hiểu cách con người chơi trò chơi này. Sau đó, chúng tôi hướng dẫn AlphaGo đấu với các phiên bản khác nhau của chính nó hàng nghìn lần, mỗi lần đều học hỏi từ những sai lầm của mình – một phương pháp được gọi là học tăng cường. Theo thời gian, AlphaGo đã tiến bộ và trở thành một người chơi giỏi hơn.
Alpha Go Lee Sedol
AlphaGo đấu với Lee Sedol
AlphaGo đấu với Lee Sedol, còn được gọi là trận đấu thử thách DeepMind, là trận đấu cờ vây kéo dài 5 ván giữa kỳ thủ cờ vây hàng đầu Lee Sedol và AlphaGo, một chương trình cờ vây trên máy tính do DeepMind phát triển, diễn ra tại Seoul, Hàn Quốc từ ngày 9 đến ngày 15 tháng 3 năm 2016. AlphaGo thắng tất cả trừ ván thứ tư; tất cả các trận đấu đều thắng bằng cách từ chức. Trận đấu được so sánh với trận cờ vua lịch sử giữa Deep Blue và Garry Kasparov năm 1997.
Người chiến thắng trong trận đấu dự kiến sẽ giành được 1 triệu đô la. Kể từ khi AlphaGo giành chiến thắng, Google DeepMind tuyên bố rằng giải thưởng sẽ được quyên góp cho các tổ chức từ thiện, bao gồm các tổ chức UNICEF và cờ vây. Lee nhận được 170.000 đô la (150.000 đô la khi tham gia năm trò chơi và thêm 20.000 đô la khi thắng một trò chơi).
Sau trận đấu, Hiệp hội Cờ vây Hàn Quốc đã trao cho AlphaGo danh hiệu đại kiện tướng cờ vây cao nhất – “9 đẳng danh dự”. Nó được trao để ghi nhận “nỗ lực chân thành” của AlphaGo trong việc thành thạo cờ vây. Trận đấu này được Science chọn là một trong những trận tranh giải đột phá của năm, vào ngày 22 tháng 12 năm 2016.
Bối cảnh
Thử thách khó khăn trong trí tuệ nhân tạo
Cờ vây là một trò chơi cờ phức tạp đòi hỏi trực giác, tư duy sáng tạo và chiến lược. Nó từ lâu đã được coi là một thách thức khó khăn trong lĩnh vực trí tuệ nhân tạo (AI) và khó giải quyết hơn đáng kể so với cờ vua. Nhiều người trong lĩnh vực trí tuệ nhân tạo cho rằng cờ vây đòi hỏi nhiều yếu tố bắt chước suy nghĩ của con người hơn là cờ vua. Nhà toán học IJ Good viết năm 1965:
Đi trên máy tính? – Để lập trình cho máy tính chơi một trò chơi cờ vây hợp lý, thay vì chỉ đơn thuần là một trò chơi hợp pháp – cần phải chính thức hóa các nguyên tắc của chiến lược tốt hoặc thiết kế một chương trình học tập. Các nguyên tắc có chất lượng và bí ẩn hơn trong cờ vua và phụ thuộc nhiều hơn vào khả năng phán đoán. Vì vậy, tôi nghĩ việc lập trình cho một máy tính để chơi một ván cờ vây hợp lý sẽ còn khó hơn là chơi cờ vua.
Trước năm 2015, các chương trình cờ vây tốt nhất chỉ đạt được cấp độ nghiệp dư. Trên bảng 9×9 nhỏ, máy tính hoạt động tốt hơn và một số chương trình đã giành được chiến thắng một phần trong số trò chơi 9×9 của họ trước những người chơi chuyên nghiệp.
Trước AlphaGo, một số nhà nghiên cứu đã tuyên bố rằng máy tính sẽ không bao giờ đánh bại được những con người giỏi nhất ở môn cờ vây. Elon Musk, một nhà đầu tư ban đầu của Deepmind, cho biết vào năm 2016 rằng các chuyên gia trong lĩnh vực này cho rằng AI phải 10 năm nữa mới giành được chiến thắng trước một kỳ thủ cờ vây chuyên nghiệp hàng đầu.
Trận đấu AlphaGo vs Lee Sedol được so sánh với trận cờ vua năm 1997 khi Garry Kasparov thua máy tính Deep Blue của IBM. Trận thua Deep Blue của Kasparov được coi là thời điểm máy tính trở nên giỏi hơn con người ở môn cờ vua.
AlphaGo khác biệt đáng kể so với những nỗ lực AI trước đây. Thay vì sử dụng các thuật toán xác suất được lập trình viên con người mã hóa cứng, AlphaGo sử dụng mạng lưới thần kinh để ước tính xác suất chiến thắng của nó.
AlphaGo truy cập và phân tích toàn bộ thư viện trực tuyến của cờ vây; bao gồm tất cả các trận đấu, người chơi, phân tích và tài liệu; cũng như các trận đấu của AlphaGo với chính nó và những người chơi khác.
Sau khi thiết lập, AlphaGo độc lập với nhóm phát triển và đánh giá con đường tốt nhất để giải cờ vây (tức là thắng trò chơi). Bằng cách sử dụng mạng lưới thần kinh và tìm kiếm cây Monte Carlo, AlphaGo tính toán số lượng khổng lồ các xác suất có thể xảy ra và không thể xảy ra trong nhiều nước đi trong tương lai.
Kết Luận
Giờ đây, những người kế nhiệm của AlphaGo – AlphaZero, MuZero và AlphaDev – đang xây dựng dựa trên di sản của AlphaGo để giúp giải quyết những thách thức ngày càng phức tạp ảnh hưởng đến cuộc sống hàng ngày của chúng ta.