Định nghĩa tác tử
- "Một tác tử là bất cứ thứ gì có thể cảm nhận môi trường xung quanh nó thông qua các cảm biến (sensors) và tác động lên môi trường đó thông qua các cơ quan phản ứng lại các tác động (effectors)."
- "Tác tử tự trị là hệ thống điện toán tồn tại trên một môi trường động phức tạp nào đó, cảm nhận và hoạt động một cách tự lập trong môi trường này, và hoạt động để đạt được một tập các mục đích hay nhiệm vụ mà chúng được thiết kế ra".
- "Một tác tử tự trị là một hệ thống được đặt vào trong một phần của môi trường, cảm nhận môi trường đó và hoạt động trong đó, qua thời gian, theo đuổi mục tiêu đạt được những việc nó cần làm và với ý định tác động theo những gì nó sẽ cảm nhận được trong tương lai"
Mô hình mức trừu tượng cơ bản của một tác tử
Khả năng phản ứng (Reactivity)
- Một tác tử phải có khả năng phản ứng (react) [dựa trên hành vi của nó] theo một cách thích hợp với những thay đổi động trong "môi trường" của nó. Môi trường này bao gồm:
- Các tác tử điện toán khác
- Các tác tử con người
- Các nguồn thông tin bên ngoài (v.d. các cảm biến)
- Các đối tượng vật lý (v.d. các robot)
- Mạng internet
- ...
- Đây là một trong số nhiều thuộc tính (properties) mà một tác tử thông minh cần có... [sẽ đề cập trong bài viết tới...]
- Khả truy (accessible) và bất khả truy (inaccessible)
- Trong một môi trường khả truy, các tác tử có thể tiếp nhận các thông tin về trạng thái của môi trường đó một cách đầy đủ, chính xác và cập nhật.
- Hầu hết những môi trường có mức độ phức tạp vừa phải (ví dụ như môi trường vật lý hàng ngày và Internet) là bất khả truy.
- Môi trường có mức độ khả truy càng cao, việc xây dựng tác tử vận hành trong môi trường đó càng đơn giản.
- Xác định (deterministic) và bất định (non-deterministic)
- Trong một môi trường xác định, mỗi hành động đều chỉ gây ra một kết quả duy nhất - không có tình trạng thiếu chắc chắn về trạng thái được gây ra bởi kết quả của một hành động xác định.
- Thế giới vật lý là môi trường bất định
- Các môi trường bất định tạo ra nhiều vấn đề phức tạp hơn cho việc thiết kế tác tử.
- Phân đoạn (episodic) và liên tiếp (non-episodic)
- Trong một môi trường phân đoạn, hành động của một tác tử chỉ phụ thuộc vào một số phân đoạn rời rạc, mà không có sự liên hệ trong hành động của tác tử đó trong những bối cảnh khác.
- Từ góc nhìn của người xây dựng tác tử, môi trường phân đoạn là đơn giản hơn bởi tác tử có thể quyết định hành động nào cần thực hiện chỉ cần dựa trên phân đoạn hiện tại - không cần thiết tính toán đến sự tương tác giữa phân đoạn đó với một phân đoạn trong tương lai.
- Tĩnh (static) và động (dynamic)
- Một môi trường tĩnh sẽ không thay đổi trừ khi chịu tác động của các tác tử trong môi trường đó.
- Một môi trường động còn có các tiến trình khác, sự biến đổi của môi trường này không chỉ gây ra bởi các tác tử.
- Thế giới vật lý là một môi trường mang tính động ở mức cao.
- Rời rạc (discrete) và liên tục (continuous)
- Một môi trường là rời rạc nếu tồn tại một số lượng cố định và hữu hạn các hành động và tri giác trong nó.
- Thế giới thực là một môi trường liên tục
Kiến trúc tác tử
- Một kiến trúc đề xuất một phương pháp luận nhằm xây dựng một tác tử tự trị.
- Cách thức biểu diễn cấu tạo của tác tử bằng một tập hợp của các module thành phần.
- Cách thức các tác tử được tạo ra để tương tác với nhau.
- Hai khía cạnh này định nghĩa cách thức để một tác tử dựa trên dữ liệu cảm nhận được và trạng thái nội tại hiện thời của nó xác định được những hành động cần thực hiện và trạng thái nội tại tương lai cho mình.
Từ tri giác đến hành động
Một số loại kiến trúc tác tử chính
- Kiến trúc phản hồi
- Chú trọng yếu tố phản ứng nhanh/phản hồi với những thay đổi của môi trường phát hiện được.
- Kiến trúc suy luận
- Chú trọng vào các kế hoạch hành động dài hạn, dựa trên một tập hợp các mục đích cơ bản.
- Kiến trúc lai
- Là kết hợp của hai kiến trúc nêu trên.
Kiến trúc phản hồi vs kiến trúc suy luận
- Robot cần đi tới một điểm được chỉ định
- Kiến trúc phản hồi
- Robot cảm nhận phía trước
- Chuyển động sang trái hoặc phải khi cảm nhận được vật cản
- Tối thiểu hóa chi phí tính toán, dựa trên vị trí hiện tại và vị trí đích
- Kiến trúc suy luận
- Biểu diễn một cách tường minh môi trường (bản đồ)
- Lập kế hoạch tìm đường đi ngắn nhất giữa vị trí hiện tại và vị trí đích
- Chi phí tính toán cao
- Có thể cần tới tái lập kế hoạch
Kiến trúc phản hồi
- Có nhiều vấn đề chưa giải quyết được (thậm chí là không thể giải được) trong lĩnh vực AI biểu tượng
- Chi phí tính toán, tìm kiếm vét cạn
- Các vấn đề cần giải quyết trong giới hạn 100 ms
- Ví dụ như nhận diện khuôn mặt
- Những vấn đề này khiến cho các nhà nghiên cứu nghi ngờ về tính khả thi của toàn bộ mô thức, và về sự phát triển của kiến trúc phản hồi.
- Cho dù thống nhất về quan điểm rằng các giả định đóng vai trò là nền tảng chủ đạo của AI có phần nào đó là sai, các nhà nghiên cứu về tác tử phản hồi sử dụng nhiều kỹ thuật khác nhau.
Tác tử phản hồi - những ý tưởng cơ bản
- Tác tử phản hồi có đặc điểm:
- nhiều nhất một biểu diễn nội tại hết sức đơn giản về thế giới.
- nhưng thể hiện một kết nối chặt chẽ giữa tri giác và hành động.
- Mô thức dựa hành vi
- Trí thông minh là một sản phẩm của sự tương tác giữa tác tử và môi trường của nó.
Ví dụ kinh điển: bầy kiến
- Một con kiến riêng lẻ thì rất hạn chế về trí thông minh, khả năng tính toán hoặc khả năng suy luận.
- Sự tương tác giữa các cá thể kiến trong bầy đàn cho phép tạo nên một hệ thống có độ phức tạp cao, có cấu trúc và hiệu quả.
Những đặc điểm chính
- Chức năng thể hiện được
- Các tác tử đơn giản
- Tương tác đơn giản
- Các mẫu hành vi phức tạp là kết quả của các tương tác động
- Hành vi tổng thể của hệ thống không được đặc trưng bởi mức độ ưu tiên (?)
- Môi trường động của các robot, phụ thuộc vào hệ thống vật cản
- Sự phân rã nhiệm vụ
- Tác tử được tạo thành từ các module tự trị
- Mỗi module quản lý một nhiệm vụ được giao
- Cảm biến, bộ điều khiển, bộ tính toán
- Sự giao tiếp giữa các module là tối thiểu, mức độ thấp
- Không có một mô hình thế giới chung
- Không có một "tác tử lập kế hoạch/điều khiển"
- Dữ liệu thô
- Dữ liệu cơ bản nhận được từ các cảm biến
- Không có một hệ quản trị ký hiệu phức tạp như trong AI cổ điển
- Không thừa nhận "Giả thuyết về hệ thống ký hiệu vật lý" [nền tảng cơ bản của AI biểu tượng]
- "Hành vi thông minh chỉ có thể đạt được trong hệ thống xử lý ký hiệu"
Khái niệm cơ bản
- Mỗi hành vi duy trì một ánh xạ từ tri giác đầu vào tới hành động đầu ra
- Hành vi phản hồi: luật hành động: S → A
- với S thể hiện các trạng thái của môi trường và A là hành động đơn giản mà tác tử có khả năng thực hiện
- Ví dụ
Giản đồ cơ bản của kiến trúc phản hồi
Không có nhận xét nào:
Đăng nhận xét