Hệ thống đa tác tử: Kiến trúc tác tử

Định nghĩa tác tử

"Một tác tử là bất cứ thứ gì có thể cảm nhận môi trường xung quanh nó thông qua các cảm biến (sensors) và tác động lên môi trường đó thông qua các cơ quan phản ứng lại các tác động (effectors)."
"Tác tử tự trị là hệ thống điện toán tồn tại trên một môi trường động phức tạp nào đó, cảm nhận và hoạt động một cách tự lập trong môi trường này, và hoạt động để đạt được một tập các mục đích hay nhiệm vụ mà chúng được thiết kế ra".
"Một tác tử tự trị là một hệ thống được đặt vào trong một phần của môi trường, cảm nhận môi trường đó và hoạt động trong đó, qua thời gian, theo đuổi mục tiêu đạt được những việc nó cần làm và với ý định tác động theo những gì nó sẽ cảm nhận được trong tương lai"

Mô hình mức trừu tượng cơ bản của một tác tử

Khả năng phản ứng (Reactivity)

Một tác tử phải có khả năng phản ứng (react) [dựa trên hành vi của nó] theo một cách thích hợp với những thay đổi động trong "môi trường" của nó. Môi trường này bao gồm:

Các tác tử điện toán khác
Các tác tử con người
Các nguồn thông tin bên ngoài (v.d. các cảm biến)
Các đối tượng vật lý (v.d. các robot)
Mạng internet
...

Đây là một trong số nhiều thuộc tính (properties) mà một tác tử thông minh cần có... [sẽ đề cập trong bài viết tới...]

Các loại môi trường

Khả truy (accessible) và bất khả truy (inaccessible)

Trong một môi trường khả truy, các tác tử có thể tiếp nhận các thông tin về trạng thái của môi trường đó một cách đầy đủ, chính xác và cập nhật.

Hầu hết những môi trường có mức độ phức tạp vừa phải (ví dụ như môi trường vật lý hàng ngày và Internet) là bất khả truy.

Môi trường có mức độ khả truy càng cao, việc xây dựng tác tử vận hành trong môi trường đó càng đơn giản.

Xác định (deterministic) và bất định (non-deterministic)

Trong một môi trường xác định, mỗi hành động đều chỉ gây ra một kết quả duy nhất - không có tình trạng thiếu chắc chắn về trạng thái được gây ra bởi kết quả của một hành động xác định.

Thế giới vật lý là môi trường bất định

Các môi trường bất định tạo ra nhiều vấn đề phức tạp hơn cho việc thiết kế tác tử.

Phân đoạn (episodic) và liên tiếp (non-episodic)

Trong một môi trường phân đoạn, hành động của một tác tử chỉ phụ thuộc vào một số phân đoạn rời rạc, mà không có sự liên hệ trong hành động của tác tử đó trong những bối cảnh khác.

Từ góc nhìn của người xây dựng tác tử, môi trường phân đoạn là đơn giản hơn bởi tác tử có thể quyết định hành động nào cần thực hiện chỉ cần dựa trên phân đoạn hiện tại - không cần thiết tính toán đến sự tương tác giữa phân đoạn đó với một phân đoạn trong tương lai.

Tĩnh (static) và động (dynamic)

Một môi trường tĩnh sẽ không thay đổi trừ khi chịu tác động của các tác tử trong môi trường đó.

Một môi trường động còn có các tiến trình khác, sự biến đổi của môi trường này không chỉ gây ra bởi các tác tử.

Thế giới vật lý là một môi trường mang tính động ở mức cao.

Rời rạc (discrete) và liên tục (continuous)

Một môi trường là rời rạc nếu tồn tại một số lượng cố định và hữu hạn các hành động và tri giác trong nó.

Thế giới thực là một môi trường liên tục

Kiến trúc tác tử

Một kiến trúc đề xuất một phương pháp luận nhằm xây dựng một tác tử tự trị.

Cách thức biểu diễn cấu tạo của tác tử bằng một tập hợp của các module thành phần.
Cách thức các tác tử được tạo ra để tương tác với nhau.
Hai khía cạnh này định nghĩa cách thức để một tác tử dựa trên dữ liệu cảm nhận được và trạng thái nội tại hiện thời của nó xác định được những hành động cần thực hiện và trạng thái nội tại tương lai cho mình.

Từ tri giác đến hành động

Một số loại kiến trúc tác tử chính

Kiến trúc phản hồi

Chú trọng yếu tố phản ứng nhanh/phản hồi với những thay đổi của môi trường phát hiện được.

Kiến trúc suy luận

Chú trọng vào các kế hoạch hành động dài hạn, dựa trên một tập hợp các mục đích cơ bản.

Kiến trúc lai

Là kết hợp của hai kiến trúc nêu trên.

Kiến trúc phản hồi vs kiến trúc suy luận

Robot cần đi tới một điểm được chỉ định

Kiến trúc phản hồi

Robot cảm nhận phía trước

Chuyển động sang trái hoặc phải khi cảm nhận được vật cản

Tối thiểu hóa chi phí tính toán, dựa trên vị trí hiện tại và vị trí đích

Kiến trúc suy luận

Biểu diễn một cách tường minh môi trường (bản đồ)

Lập kế hoạch tìm đường đi ngắn nhất giữa vị trí hiện tại và vị trí đích

Chi phí tính toán cao

Có thể cần tới tái lập kế hoạch

Kiến trúc phản hồi

Có nhiều vấn đề chưa giải quyết được (thậm chí là không thể giải được) trong lĩnh vực AI biểu tượng

Chi phí tính toán, tìm kiếm vét cạn
Các vấn đề cần giải quyết trong giới hạn 100 ms

Ví dụ như nhận diện khuôn mặt

Những vấn đề này khiến cho các nhà nghiên cứu nghi ngờ về tính khả thi của toàn bộ mô thức, và về sự phát triển của kiến trúc phản hồi.
Cho dù thống nhất về quan điểm rằng các giả định đóng vai trò là nền tảng chủ đạo của AI có phần nào đó là sai, các nhà nghiên cứu về tác tử phản hồi sử dụng nhiều kỹ thuật khác nhau.

Tác tử phản hồi - những ý tưởng cơ bản

Tác tử phản hồi có đặc điểm:

nhiều nhất một biểu diễn nội tại hết sức đơn giản về thế giới.
nhưng thể hiện một kết nối chặt chẽ giữa tri giác và hành động.

Mô thức dựa hành vi
Trí thông minh là một sản phẩm của sự tương tác giữa tác tử và môi trường của nó.

Ví dụ kinh điển: bầy kiến

Một con kiến riêng lẻ thì rất hạn chế về trí thông minh, khả năng tính toán hoặc khả năng suy luận.
Sự tương tác giữa các cá thể kiến trong bầy đàn cho phép tạo nên một hệ thống có độ phức tạp cao, có cấu trúc và hiệu quả.

Những đặc điểm chính

Chức năng thể hiện được

Các tác tử đơn giản

Tương tác đơn giản

Các mẫu hành vi phức tạp là kết quả của các tương tác động

Hành vi tổng thể của hệ thống không được đặc trưng bởi mức độ ưu tiên (?)

Môi trường động của các robot, phụ thuộc vào hệ thống vật cản

Sự phân rã nhiệm vụ

Tác tử được tạo thành từ các module tự trị

Mỗi module quản lý một nhiệm vụ được giao

Cảm biến, bộ điều khiển, bộ tính toán

Sự giao tiếp giữa các module là tối thiểu, mức độ thấp

Không có một mô hình thế giới chung

Không có một "tác tử lập kế hoạch/điều khiển"

Dữ liệu thô

Dữ liệu cơ bản nhận được từ các cảm biến

Không có một hệ quản trị ký hiệu phức tạp như trong AI cổ điển

Không thừa nhận "Giả thuyết về hệ thống ký hiệu vật lý" [nền tảng cơ bản của AI biểu tượng]

"Hành vi thông minh chỉ có thể đạt được trong hệ thống xử lý ký hiệu"

Khái niệm cơ bản

Mỗi hành vi duy trì một ánh xạ từ tri giác đầu vào tới hành động đầu ra
Hành vi phản hồi: luật hành động: S → A

với S thể hiện các trạng thái của môi trường và A là hành động đơn giản mà tác tử có khả năng thực hiện

Ví dụ

Hệ thống đa tác tử

Thứ Năm, 16 tháng 6, 2016

Kiến trúc tác tử

Định nghĩa tác tử

Mô hình mức trừu tượng cơ bản của một tác tử

Khả năng phản ứng (Reactivity)

Các loại môi trường

Kiến trúc tác tử

Một kiến trúc đề xuất một phương pháp luận nhằm xây dựng một tác tử tự trị.

Từ tri giác đến hành động

Một số loại kiến trúc tác tử chính

Kiến trúc phản hồi

Chú trọng yếu tố phản ứng nhanh/phản hồi với những thay đổi của môi trường phát hiện được.

Kiến trúc suy luận

Chú trọng vào các kế hoạch hành động dài hạn, dựa trên một tập hợp các mục đích cơ bản.

Kiến trúc lai

Là kết hợp của hai kiến trúc nêu trên.

Kiến trúc phản hồi vs kiến trúc suy luận

Kiến trúc phản hồi

Tác tử phản hồi - những ý tưởng cơ bản

Ví dụ kinh điển: bầy kiến

Những đặc điểm chính

Khái niệm cơ bản

Giản đồ cơ bản của kiến trúc phản hồi

Không có nhận xét nào:

Đăng nhận xét

Thứ Năm, 16 tháng 6, 2016

Kiến trúc tác tử

Định nghĩa tác tử

Mô hình mức trừu tượng cơ bản của một tác tử

Khả năng phản ứng (Reactivity)

Các loại môi trường

Kiến trúc tác tử

Một kiến trúc đề xuất một phương pháp luận nhằm xây dựng một tác tử tự trị.

Từ tri giác đến hành động

Một số loại kiến trúc tác tử chính

Kiến trúc phản hồi Chú trọng yếu tố phản ứng nhanh/phản hồi với những thay đổi của môi trường phát hiện được.

Kiến trúc suy luận Chú trọng vào các kế hoạch hành động dài hạn, dựa trên một tập hợp các mục đích cơ bản.

Kiến trúc lai Là kết hợp của hai kiến trúc nêu trên.

Kiến trúc phản hồi vs kiến trúc suy luận

Kiến trúc phản hồi

Tác tử phản hồi - những ý tưởng cơ bản

Ví dụ kinh điển: bầy kiến

Những đặc điểm chính

Khái niệm cơ bản

Giản đồ cơ bản của kiến trúc phản hồi

Không có nhận xét nào:

Đăng nhận xét

Kiến trúc phản hồi

Chú trọng yếu tố phản ứng nhanh/phản hồi với những thay đổi của môi trường phát hiện được.

Kiến trúc suy luận

Chú trọng vào các kế hoạch hành động dài hạn, dựa trên một tập hợp các mục đích cơ bản.

Kiến trúc lai

Là kết hợp của hai kiến trúc nêu trên.