Xe ô tô tự lái là xu hướng đang thu hút sự chú ý của các công ty lớn. Mặc dù hiện nay chưa có xe tự lái hoàn toàn nhưng đã có những chiếc ô tô với hệ thống hỗ trợ người lái tiên tiến (ADAS) có khả năng lái tự động, chuyển làn, đậu xe và kiểm soát hành trình theo tình hình giao thông. Trong đó machine vision – thị giác máy là nền tảng của ô tô tự lái và có vai trò rất quan trọng đối với công nghệ tự động hoàn toàn trong tương lai.

Xe ô tô tự lái sử dụng nhiều cảm biến trong hệ thống ADAS, trong đó thị giác máy là cơ chế chủ đạo để phát hiện, xác định và tính toán khoảng cách của các vật thể trong môi trường xung quanh. Nếu không có thị giác máy thì rất khó tạo ra những chiếc ô tô tự lái có hệ thống kiểm soát hành trình và lái tự động.

Thị giác máy là gì?

Machine vision – thị giác máy là công nghệ cho phép máy móc nhìn thấy và nhận biết các vật thể trong môi trường xung quanh. Đây là một nhánh của computer vision (thị giác máy tính) tập trung vào chức năng phát hiện các vật thể dựa trên thị giác được ứng dụng trong các máy móc tự động như robot và xe cộ.

Thị giác máy ứng dụng trong sản xuất (Ảnh: Internet)
Thị giác máy ứng dụng trong sản xuất (Ảnh: Internet)

Thị giác máy ngày nay sử dụng các thuật toán học sâu AI như mạng thần kinh tích chập (CNN) để tạo ra các mô hình mạnh và tổng quát, có thể phát hiện chính xác các vật thể trong nhiều điều kiện môi trường khác nhau. Điều này cho phép triển khai thị giác máy trong các nhiệm vụ đòi hỏi độ tin cậy cao trong lĩnh vực sản xuất, nông nghiệp, robot và ô tô.

Thị giác máy hoạt động như thế nào trong xe tự lái?

Thị giác máy trong ô tô tự lái thường được tạo thành từ 3 bộ phận: hệ thống camera, xử lý (máy tính biên) và AI. Cấu trúc này cho phép chiếc xe có thể nhìn, suy nghĩ và xác định các dấu hiệu và chướng ngại vật khi chạy trên đường. Hãy cùng tìm hiểu sâu hơn về từng bộ phận để xem các công nghệ này phối hợp hoạt động với nhau như thế nào.

Các bộ phận làm nên thị giác máy của ô tô tự lái (Ảnh: Internet)
Các bộ phận làm nên thị giác máy của ô tô tự lái (Ảnh: Internet)

Hệ thống camera

Thị giác máy dựa vào hệ thống camera để thu thập thông tin hình ảnh về môi trường xung quanh. Các camera được lắp đặt xung quanh xe để thu thập càng nhiều hình ảnh càng tốt. Hai loại cảm biến được sử dụng chủ yếu trong camera là chất bán dẫn oxit kim loại bổ sung (CMOS) và thiết bị ghép điện tích (CCD).

Đối với xe tự lái, CMOS thường được ưu tiên vì tốc độ đọc nhanh, các linh kiện điện tử mạnh và khả năng xử lý song song giúp nó xử lý nhanh hơn, nhưng bù lại dễ bị nhiễu và ảnh giả. Một số phương pháp có thể hỗ trợ cảm biến CMOS trong điều kiện ánh sáng không tốt gồm các chế độ chiếu sáng khác nhau, tầm nhìn ban đêm kỹ thuật số và các bộ lọc.

Các camera trên xe tự lái được lắp đặt với khoảng cách nhất định với nhau để tạo ra tầm nhìn lập thể bao quát – đó là khả năng kết hợp nhiều hình ảnh từ góc nhìn khác nhau để tạo ra cảm giác chiều sâu như không gian 3 chiều của các vật thể và môi trường. Điều này cho phép máy có thể tính toán khoảng cách giữa vật thể và ô tô một cách gần đúng.

Con người có hai mắt nên cũng tạo ra tầm nhìn lập thể. Bạn có thể tự kiểm tra bằng cách nhắm một mắt lại và đặt bàn tay của bạn cách một vật nhỏ nào đó ít nhất 5cm, tạm dừng vài giây và ước lượng khoảng cách giữa tay với vật đó, sau đó mở cả hai mắt và so sánh cảm nhận về chiều sâu khác nhau như thế nào.

Máy tính biên

Trong khi hệ thống camera trên xe tự lái thu thập dữ liệu, một máy tính tích hợp (bộ xử lý biên) sẽ xử lý tất cả thông tin đầu vào theo thời gian thực để cập nhật trạng thái môi trường xung quanh ngay lập tức. Các hệ thống thị giác máy thông thường có thể tiết kiệm chi phí bằng cách sử dụng điện toán đám mây, nhưng kết nối với đám mây sẽ gây ra nhiều rủi ro cho xe tự lái.

Sử dụng máy tính biên để xử lý dữ liệu đầu vào sẽ tránh được các vấn đề do độ trễ và đảm bảo dữ liệu được tiếp nhận, xử lý và truyền đi theo thời gian thực. Máy tính biên cho xe tự lái sử dụng các công cụ máy tính chuyên dụng tích hợp bộ xử lý đồ họa AI như Tensor Core và CUDA Cores của NVIDIA.

Thuật toán AI

Thuật toán luôn là một phần quan trọng của thị giác máy, cho phép máy tính xác định các khuôn mẫu, hình dạng và màu sắc trong hình ảnh do camera cung cấp. Sử dụng AI thay vì các thuật toán thị giác máy truyền thống giúp tăng cường đáng kể khả năng của xe tự lái trong việc xác định các vật thể, biển báo, vạch kẻ đường và đèn giao thông một cách chính xác.

Nhiều thuật toán AI đang được sử dụng để huấn luyện xe tự lái, trong đó phổ biến nhất là:

YOLO (You Only Look Once): Thuật toán phát hiện đối tượng theo thời gian thực giúp xác định và theo dõi các đối tượng trong tầm nhìn của xe.

SIFT (Scale-Icar’sant Feature Transform): có chức năng trích xuất các đặc điểm hình ảnh giúp hệ thống nhận ra các điểm mốc và vật thể đặc biệt trong môi trường xung quanh.

Biểu đồ độ dốc định hướng (HOG): giúp nhận dạng đối tượng, tập trung vào việc trích xuất các khuôn mẫu và độ dốc cục bộ từ hình ảnh.

TextonBoost: Thuật toán giúp nhận dạng đối tượng bằng cách phân tích kết cấu trong môi trường.

AdaBoost: có chức năng phân loại dữ liệu, kết hợp nhiều bộ phân loại yếu để đưa ra quyết định chính xác về các vật thể và chướng ngại vật trên đường đi của xe.

Tầm quan trọng của thị giác máy đối với xe ô tô tự lái

Mô hình ô tô đa giác (Ảnh: Internet)
Mô hình ô tô đa giác (Ảnh: Internet)

Thị giác máy là công nghệ chủ đạo giúp xe tự lái có thể cảm nhận và hiểu được môi trường xung quanh. Nếu không có thị giác máy, rất có thể ô tô tự lái sẽ bị đẩy lùi xuống cấp độ 1 trên thang đo khả năng tự lái của phương tiện và có thể không bao giờ đạt được khả năng tự chủ hoàn toàn.

Nhờ thị giác máy, ô tô tự lái có khả năng phân loại các đối tượng, phát hiện làn đường và các tín hiệu, nhận dạng biển báo và tình hình giao thông. Nhiều phương tiện tự lái hiện nay sử dụng các loại cảm biến khác như LIDAR, RADAR và SONAR, nhưng tất cả đều dựa chủ yếu vào thị giác máy để quan sát môi trường, xác định vật thể và hiểu ý nghĩa của các biển báo và đèn giao thông trên đường. Tất cả những cảm biến bổ sung kia chỉ nhằm mục đích tăng cường cho thị giác máy và đảm bảo an toàn cho con người, động vật và tài sản.

Mặt khác, thị giác máy có thể hoạt động độc lập mà không cần sự trợ giúp của các cảm biến khác để thực hiện quá trình lái tự động. Trên thực tế, những chiếc xe tự lái mới nhất của Tesla đã loại bỏ RADAR và hiện tại chỉ dựa vào thị giác máy cho hệ thống tự lái Autopilot. Điều đó không đồng nghĩa với việc xem thường các công nghệ cảm biến khác, nhưng cũng cho thấy tầm quan trọng và sức mạnh của thị giác máy trong ô tô tự lái ngày nay.

Tương lai của thị giác máy trong ô tô tự lái

Thị giác máy là nền tảng của xe tự lái, giúp xe có thể nhìn và cảm nhận môi trường chính xác giống như con người. Mặc dù vẫn còn nhiều thách thức nhưng không thể đánh giá thấp lợi ích của công nghệ này về độ an toàn và vận hành xe. Những tiến bộ hơn nữa về AI, máy tính biên và camera chắc chắn sẽ giúp xe tự lái hoạt động hiệu quả hơn và tự động hóa cao hơn.

Mời bạn xem thêm các bài liên quan:

Hãy theo dõi BlogAnChoi để cập nhật nhiều thông tin bổ ích nhé!

Xem thêm

Hãng xe Jaguar: Hành trình qua thời gian của thương hiệu sang trọng và đẳng cấp

Hãy bắt đầu hành trình khám phá thế giới của sự sang trọng và đẳng cấp với Jaguar - một biểu tượng trong ngành công nghiệp ô tô. Jaguar không chỉ là một hãng xe, mà là một tượng đài của sự kiêu hãnh, đẳng cấp và đổi mới. Từ lịch sử đầy hào hùng đến thiết kế động ...
Theo dõi bình luận
Thông báo về
guest
2 Bình luận
Bình chọn nhiều nhất
Mới nhất Cũ nhất
Phản hồi nội tuyến
Xem tất cả bình luận
Phạm Long Thuyên

mấy công nghệ này lạ ghê