Chuyên gia của IBM nói về Deep Blue, AlphaGo và tương lai của trí thông minh nhân tạo

Trí thông minh nhân tạo AlphaGo của Google đã đánh bại nhà vô địch cờ vây thế giới Lee Sedol, điều mà nhiều người cho rằng phải ít nhất 10 năm nữa mới làm được. Còn nhớ cách đây gần 2 thập kỷ thì IBM cũng từng làm ra điều tương tự khi máy tính Deep Blue của họ đánh bại kiện tướng cờ vua thế giới Garry Kasparov. Một trong những người phát triển Deep Blue là Murray Campbell đã có cuộc nói chuyện về chiến thắng lần này của AlphaGo, sự tiến hóa của AI so với Deep Blue và tương lai của nó. Xin được lược dịch lại đoạn đối thoại này cho các bạn tham khảo.

Đã qua gần 20 năm kể từ chiến thắng nổi tiếng của DeepBlue. Làm thế nào các bạn có thể thách thức cờ vua và đánh bại Kasparov?

Kiện tướng cờ vua Garry Kasparov bị Deep Blue của IBM đánh bại hồi năm 1997

Thực ra chúng tôi đã bắt đầu làm việc với các chương trình cờ vua từ khi còn là sinh viên ở Đại học Carnegie Mellon, IBM đã thuê 3 người chúng tôi về và phát triển cỗ máy đánh cờ thế hệ mới, sau này chính là Deep Blue. Chúng tôi nhận ra rằng cách tiếp cận dùng brute-force thuần túy không đủ để đánh bại nhà vô địch, bởi không chỉ đòi hỏi nhiều tài nguyên tính toán mà còn có sự tương quan giữa sức mạnh của một chương trình và tốc độ tính toán của nó. Vì vậy chúng tôi kết hợp một dạng AI tiên tiến lúc đó trong các thuật toán, trong việc tìm kiếm và đánh giá, cùng với một siêu máy tính để tạo nên hệ thống có thể đánh bại nhà vô địch cờ vua. Thật ra chúng tôi đã thua hồi năm 1996 nhưng trở lại 1 năm sau đó với hệ thống được cải tiến và giành chiến thắng.

Ở mức độ con người, động lực nào giúp ông muốn trở thành người đầu tiên làm được máy tính đánh bại con người? Là do sở thích cá nhân với cờ vua, hay là một đưa máy tính lên thách thức con người?

Vâng, tôi có thể nói là cả 2. Tôi chắc chắn là một người quan tâm tới cờ vua, tôi là một người đánh cờ trước khi là nhà khoa học máy tính. Tôi từng vô địch giải cờ vua ở Alberta, Canada. Nhưng tôi có thể nhận thấy rằng những người thật sự đánh cờ giỏi còn sở hữu những cái mà tôi không có. Điều đó khiến tôi quan tâm tới việc tạo ra một chiếc máy tính khả năng đánh cờ ở mức độ cao cấp. Tôi luôn duy trì mối quan tâm đó để tự rèn luyện bản thân. Nên khi gia nhập IBM, tôi thấy đó là một cơ hội để biến suy nghĩ thành hiện thực.

Nhưng bên cạnh sở thích cá nhân, đó còn là một thách thức đặt ra cho ngành khoa học máy tính từ những ngày sơ khai. Hồi năm 1949 nhà toán học nổi tiếng Claude Shannon đã có một báo cáo, trong đó ông đặt ra vấn đề rằng thế giới sẽ ra sao nếu có một máy tính đánh cờ vua. Lúc đó, ông cho rằng điều đó rất phức tạp và là một thách thức vô cùng lớn.

Ông có cần những kinh nghiệm cá nhân của bản thân trong quá trình tạo ra hệ thống máy tính đánh cờ?

Tôi nghĩ rằng có một số kiến thức về cờ vua là điều quan trọng. Vào giai đoạn đầu của quá trình phát triển thì điều đó lại không quan trọng đối với chúng tôi, nhưng sau khi dự án bước vào giai đoạn cuối để chuẩn bị cho một cuộc đối đầu với nhà vô địch thì có nhiều chi tiết nhỏ được đặt ra, về cách ván cờ được chơi, những tiêu chuẩn của các đại kiện tướng và do đó, chúng tôi phải đi tham khảo ý kiến của một chuyên gia, đồng thời là một đại kiện tướng Joel Benjamin. Và ngay thời điểm hoàn thành dự án, chúng tôi đã mời thêm các đại kiện tướng khác để đánh giá khả năng chơi cờ của hệ thống.

Có phải mục tiêu của ông là mô phỏng phong cách đánh cờ như người, hoặc phát triển một hệ thống có thể chiến thắng bằng mọi giá?

Tôi nghĩ suy cho cùng thì chúng tôi không cố gắng mô phỏng phong cách con người, tất cả chỉ giới hạn trong phạm vi những nước đi mà con người chơi tốt và chúng tôi cũng muốn máy tính chơi tốt được giống như vậy. Phong cách chơi của con người cũng được đưa ra nghiên cứu, vấn đề đó vẫn chưa hoàn toàn được hiểu rõ nhưng có nhiều nghiên cứu tiến hành bởi các nhà tâm lý học trong suốt nhiều thập kỷ qua đều cho rằng những người cao cờ hoặc các đại kiện tướng chỉ nhìn vào một số nước đi và thế cờ nhỏ để phán xét và ra quyết định. Đôi khi họ phải tính toán rất sâu sắc để quyết định những nước cần đi, đôi khi lại không. Tuy nhiên họ rất sắc xảo trong việc đánh giá các thế cờ và tìm kiếm cơ chế trong việc quyết định xem sẽ chọn hướng đi nào nhằm khám phá nó. Vì vậy, rất khó để mô phỏng lại phong cách chơi cờ của con người.

Công việc cơ bản của trí thông minh nhân tạo là cố gắng tạo ra một chiếc máy tính có thể chơi theo cách của con người và chúng dễ dàng bị đánh bại bởi những chiếc máy tính khác sử dụng phong cách "máy tính hơn", sẽ khá nông cạn nếu bạn đánh giá rằng những chiếc máy biết càng nhiều nước đi thì nó càng tốt. Nhưng nếu chỉ nhìn vào một danh sách những thế cờ để ra quyết định thì chưa thể đáng nể được. Và sau đó chúng ta phải thực sự mô phỏng các khía cạnh nhất định của người chơi. Con người rất giỏi trong việc theo dõi các nước chơi với sự phân tích sâu sắc, và chúng tôi cần làm sao cho hệ thống máy tính cũng làm được chuyện đó. Đây cũng chính là một trong những điều quan trọng tạo nên thành công cho Deep Blue.

Vào năm 1997, có lẽ nhiều người sẽ rất bất ngờ trước thất bại của Kasparov và nghĩ rằng Deep Blue là một cái gì đó rất phi thường đúng không?

Vâng, các cảm nhận đó vẫn còn tồn tại cho tới bây giờ. Bạn có thể không ngờ rằng máy tính có thể đi được một nước cờ hay như vậy và người ta gọi đó là "nước cờ của máy". Người ta chỉ nghĩ rằng máy tính với một cách nhất định hoặc một số thế cờ nhất định thì khó lòng có thể đánh bại họ huống hồ là những kỳ thủ có hạng. Tuy nhiên, đó chính là lý do tại sao máy tính có thể đánh bại con người ngay cả khi họ không đánh giá các nước đi một cách chính xác: máy có thể đánh bại con người bởi chúng chỉ nhìn vào những nước đi mà con người ít để ý tới. Tuy nhiên tôi có thể nói rằng các thế hệ kỳ thủ trẻ hiện nay dường như có nhiều khả năng để chống lại các nước đi của máy tính so với thế hệ kỳ thủ trước. Tôi cho rằng do họ đã lớn lên khi chơi với máy tính và hiểu về nó hơn.

Vậy phải chăng suy cho cùng sự phát triển của máy tính sẽ khiến con người ngày càng giỏi lên?

Tôi nghĩ điều đó hoàn toàn đúng.

Ông nghĩ việc phát triển máy tính đánh cờ vây và cơ vua có những khác biệt gì về những kiến thức cần thiết?

​Tôi không chơi cờ vây. Tôi chỉ chơi vài lần trong đời nhưng tôi biết một số kiến thức nhất định về nó. Cả 2 trò chơi đều rất phong phú và phức tạp với rất nhiều nước đi. Nhưng cờ vây có đặc điểm khác so với cờ vua chính là rất khó để đánh giá một nước đi chỉ bằng cách nhìn vào nước đi đó. Một người chơi ở mức trung bình như tôi có thể ngồi xuống và mất vài giờ để viết ra những đoạn mã nhằm định lượng mức độ tốt, xấu của một nước cờ vua, và nó đã đủ tốt để bạn kết hợp với nhiều thứ khác nếu muốn tạo ra một hệ thống chơi cờ chất lượng cao.


Nhưng cờ vây thì khác bởi nó được xây dựng dần dần trong lúc chơi, nó phát triển cả về cấu trúc lẫn những tương tác trong nhiều cách phức tạp. Cờ vua là một trò chơi mà các quân cờ di chuyển với cường độ cao. Cờ vua không có nhiều cấu trúc tĩnh và bạn có thể đưa ra những ước tính đủ tốt nhằm xác định người thắng cuộc chỉ dựa vào những quân cờ mà mỗi người chơi sở hữu. Còn cờ vây không phải như vậy, bạn không thể đếm các quân bởi mỗi bên đều có số quân xấp xỉ bằng nhau. Do đó việc ước lượng là khó hơn rất nhiều và tôi nghĩ rằng hệ thống nào làm được chuyện đó thì nó phải tiếp cận vấn đề bằng hệ thống machine learning.

Ông nghĩ gì về AlphaGo - nó đã sử dụng những kỹ thuật đó như thế nào và liệu chúng có trang bị cho Deep Blue được hay không?

Tôi đã có dịp nói chuyện với đội ngũ phát triển DeepMind của Google. Rõ ràng sản phẩm của họ là rất đáng ngạc nhiên, họ đã nâng cấp AI lên một tầm cao mới và nếu họ có thể chứng minh rằng kỹ thuật này không chỉ áp dụng cho cờ vây mà còn cho nhiều trò chơi khác thì thật đáng nể. Nhưng hiện tại thì chúng ta chỉ mới thấy sự ấn tượng của nó trong một phạm vi nhỏ.

Về việc áp dụng kỹ thuật này cho cờ vua thì tôi nghĩ rằng có lẽ nó có thể tạo ra một chương trình đủ mạnh để đánh bại các nhà vô địch cờ vua nhưng điều đó không thật sự là một bước tiến. Tôi nghĩ những chương trình đánh cờ vua hiện nay đã rất mạnh và hoàn toàn có thể đánh bại con người. Và tôi không nghĩ rằng cách tiếp cận của AlphaGo sẽ giúp cải thiện sức mạnh của các ứng dụng đánh cờ vua hiện tại. Đó là lý do tại sao tôi nói rằng cờ vua có phẩm chất rất khác so với cờ vây. Tuy nhiên, còn nhiều phần của cờ vây đòi hỏi những thuật toán sâu sắc hơn nữa, thách thức nhóm phát triển Google tiếp tục phát triển, đặc biệt là về sự tương tác giữa các nước đi và lượng giá toàn cục trận cờ.

Nhưng AlphaGo có thể tự chơi với chính nó để phát triển khả năng, ông nghĩ sao về điều này?

Vâng, tôi đồng ý rằng nó có thể tự hoàn thiện bản thân bằng cách tự chơi với chính nó. Nhưng tôi không chắc rằng liệu nó có một điểm giới hạn nào không hay sẽ luôn được cải thiện qua thời gian. Dựa trên những cảm nhận xuất phát từ hiểu biết của tôi về 2 môn cờ thì cách tiếp cận này của AlphaGo nếu mang sang cờ vua thì sẽ không thể vượt qua các ứng dụng cờ vua tiên tiến hiện nay.

Vấn đề sức mạnh xử lý có gì quan trọng đối với 2 môn cờ này?

Vâng, sức mạnh xử lý không mấy quan trọng đối với cờ vua. Bạn càng quăng cho nó nhiều xử lý thì nó sẽ càng tốt hơn, nhưng sức mạnh của một chiếc smartphone đã có thể đánh bại gần như tất cả mọi người trên thế giới. Các thuật toán đã được tinh chỉnh rất nhiều để quá trình hoạt động hiệu quả hơn. Hệ thống AlphaGo sử dụng nhiều tài nguyên xử lý, báo cáo cũng chỉ ra rằng nó sẽ hoàn thiện hơn nếu bạn thêm càng nhiều CPU và GPU càng tốt, do đó tôi đoán rằng cỗ máy AlphaGo thi đấu vừa qua sẽ đòi hỏi rất nhiều sức mạnh tính toán. (Nhóm phát triển DeepMind cho biết rằng họ cùng sử dụng một sức mạnh khi đấu vớ Sedol mới đây và đấu với Fan Hui hồi năm ngoái).

Chiến thắng lần này của AlphaGo có ý nghĩ gì đối với thực tiễn?

Tôi nghĩ rằng có những cơ chế tốt để kiểm soát một trận cờ vây. Một phần vì ngay cả khi nó vô cùng phức tạp nếu nhìn thoáng qua nhưng theo tôi ở những khía cạnh khác nó vẫn rất đơn giản. Bởi lẽ đây là một trò chơi thông tin hoàn hảo, một trò chơi có tổng bằng không (zero-sum game), nó được tiến hành theo từng lượt và sẽ không có yếu tố cơ hội trong đó. Những đặc tính này không thể phản ánh các vấn đề trong thế giới thực. Có rất ít các vấn đề thực tế mà toàn bộ những thứ bạn cần đều có ở trước mặt bạn, và khi bạn thực hiện một hành động hoặc ra một quyết định, hậu quả của quyết định đó là rõ ràng đối với bạn.

Thêm một điều mà tôi muốn đề cập tới là về việc đưa công nghệ của AlphaGo ra các ứng dụng ngoài đời thật. Tôi không nghĩ rằng hệ thống này sẽ nhanh chóng trở nên siêu phàm và vượt mặt con người. Sẽ có một số ứng dụng cụ thể là công nghệ này sẽ làm tốt, nhưng nó lại làm dở đối với một số ứng dụng khác. Tương tự như vậy, có những thứ máy làm tốt hơn người và ngược lại, do đó cả 2 sẽ làm việc cùng nhau để bổ sung cho nhau.

Tham khảo ThevergeSMWiredNature


Bài viết liên quan:

DANH NGÔN CỜ VUA

Emanuel Lasker