Chủ YếU Đổi Mới Trí tuệ nhân tạo của Google 'Alpha Go Zero' vừa được nhấn đặt lại về cách tìm hiểu

Trí tuệ nhân tạo của Google 'Alpha Go Zero' vừa được nhấn đặt lại về cách tìm hiểu

Tử Vi CủA BạN Cho Ngày Mai

Nhớ (mơ hồ) bạn đã học cách đi bộ, nói chuyện, đi xe đạp hoặc lái xe như thế nào? Nó lộn xộn và đầy sai lầm, nhưng những kỹ năng bạn học được theo cách đó vẫn tồn tại. Bên ngoài các hệ thống sống, thật khó để cấu trúc các thuật toán đủ mạnh để tiếp nhận 'trải nghiệm cuộc sống thực' và phát triển các hành vi thích ứng và có tính ổn định cho trí tuệ nhân tạo.

Vâng, Alpha Go Zero vừa làm được.

'Nó bắt đầu từ một phiến đá trống và chỉ tìm ra cho chính nó, chỉ từ việc tự chơi và không có bất kỳ kiến ​​thức nào của con người, hoặc bất kỳ dữ liệu hoặc tính năng hoặc ví dụ nào của con người, hoặc sự can thiệp từ con người. Nó khám phá ra cách chơi cờ vây từ những nguyên tắc đầu tiên, 'giáo sư David Silver của DeepMind cho biết.

AI đã có một số lần lặp lại, mỗi lần đều thông minh hơn và có khả năng hơn cái trước. Phiên bản trước sử dụng một cơ sở dữ liệu khổng lồ về các trò chơi trước đó cùng với một loạt các thuật toán hướng nó đến chiến thắng. Cách làm đó đã dẫn đến thất bại của nhà đương kim vô địch thế giới cờ vây chuyên nghiệp. Trong poker, AI Libratus gần đây đã thu về gần 2 triệu đô la của những người chơi poker hàng đầu thế giới, cũng bằng cách học thông qua cách tự chơi thay vì dữ liệu trò chơi của con người.

Giờ đây, trong phiên bản Alpha Go mới nhất này, chương trình trí tuệ nhân tạo đã dạy chinh no cách chơi cờ vây - không có nền tảng con người.

Chạy hàng triệu trò chơi mô phỏng với chính nó, phải mất 40 ngày để nó học - từ đầu - cách đánh bại phiên bản vô địch Thế giới của chính nó. Điều đó thực sự thay đổi cuộc chơi, không chỉ đối với cờ vây, mà còn đối với cách khám phá kiến ​​thức mới. Mức độ chính xác hoặc đầy đủ của kiến ​​thức chuyên môn về miền của bạn như thế nào? Có rất nhiều để khám phá thêm, đó là điều mà thử nghiệm hấp dẫn khi học với Alpha Go Zero đang cho chúng ta biết.

'Ý tưởng của Alpha Go không phải là đi ra ngoài và đánh bại con người, mà thực sự là để khám phá ý nghĩa của việc làm khoa học - để một chương trình có thể tự học hỏi kiến ​​thức là gì,' theo Silver trong một bài đăng trên YouTube về thành tích.

Nhóm Alpha Go Zero Deep Mind gọi nó là nguyên tắc đầu tiên, 'tabula rasa' (phương tiện trống).

'Nếu bạn có thể đạt được tabula rasa học hỏi, bạn có một tác nhân có thể được cấy ghép từ trò chơi Cờ vây bất kỳ miền nào khác và các chi tiết cụ thể của trò chơi bạn đang tham gia, bạn đưa ra một thuật toán tổng quát đến mức có thể áp dụng ở mọi nơi, 'ông nói . Đó là một ý tưởng khiêu khích khi bạn mở rộng khái niệm. Chỉ cần nghĩ xem chúng ta có thể làm gì với một tập hợp các thuật toán học tập, mạnh mẽ có thể giải quyết các vấn đề khó khăn một cách có hệ thống và học nhanh hơn kiến ​​thức chung của nền văn minh của chúng ta. . . tính bằng ngày chứ không phải hàng chục năm.

Hiện tại, điểm mấu chốt lớn là 'các thuật toán quan trọng hơn nhiều so với tính toán hoặc dữ liệu có sẵn,' Silver nói. Chỉ riêng điều này đã là một yếu tố thay đổi cuộc chơi trong cách chúng ta tiếp cận mở rộng thế giới đã biết. Mặc dù Alpha Go chạy trên phần cứng khoảng 25 triệu đô la - nó không chính xác là một hệ thống nhẹ - bạn biết các chuyên gia về AI từ lâu đã làm việc để tạo ra các bộ dữ liệu sạch hơn, tốt hơn. Ngày nay, nhiều bộ dữ liệu lớn được coi là quá ồn ào - chứa đầy dữ liệu xấu - để đào tạo chính xác trí thông minh nhân tạo. Nếu AI đang học hỏi từ dữ liệu, và dữ liệu xấu, nó sẽ không học. Vấn đề lớn.

Điều gì sẽ xảy ra nếu bạn không cần dữ liệu sạch mà chỉ cần trải nghiệm và trí tuệ nhân tạo có thể tự đào tạo?

Đó là thành tích thú vị trong Alpha Go Zero. Mặc dù nó nằm trong thế giới trò chơi dựa trên quy tắc thích hợp, nó có ý nghĩa lớn trong mọi ngành làm việc từ các quy tắc vật lý - hóa học suy nghĩ, giao thông, sinh học, dược học, du lịch, hậu cần và sản xuất. Nếu chúng ta có thể thiết kế các quy tắc linh hoạt để chúng có thể hoạt động từ kinh nghiệm rộng hơn và có định hướng để chúng luôn tạo ra kỹ năng mạnh mẽ hơn - như Alpha Go Zero - thì có thể đạt được trí tuệ nhân tạo làm chủ các hệ thống. Các hệ thống này sẽ không cần dữ liệu bên ngoài, không có vấn đề làm sạch dữ liệu và không cần con người làm chậm vòng lặp. Đó là một phần lý do tại sao công ty mẹ của Google, Alphabet, đặt cược công ty vào trí tuệ nhân tạo và đang đầu tư vào trí tuệ nhân tạo với tốc độ nhanh chóng. (Amazon cũng đang đầu tư vào trí tuệ nhân tạo, như thương vụ mua lại AI mới nhất của họ là BodyLabs.)

Giáo sư David Silver của Deep Mind nói, 'thực tế là chúng tôi đã thấy một chương trình đạt được hiệu suất cao ... có nghĩa là bây giờ chúng tôi có thể bắt đầu giải quyết một số vấn đề thách thức và tác động nhất đối với nhân loại.'

Bài đăng này đã được cập nhật để làm rõ rằng AI Libratus gần đây đã đánh bại những người chơi poker hàng đầu bằng cách sử dụng chiến lược liên quan đến việc tự chơi thay vì dữ liệu do con người nhập.