Thử nghiệm của ISHN về AI trong đánh giá rủi ro
Một trong những chức năng cốt lõi và được yêu cầu nhiều nhất trong lĩnh vực HSE là đánh giá rủi ro. Nếu AI muốn thay thế các chuyên gia về HSE, trước hết nó phải chứng minh được khả năng nhận diện các mối nguy và đánh giá rủi ro tại nơi làm việc một cách đáng tin cậy.
Để kiểm chứng khả năng này, tạp chí ISHN (Industrial Safety and Hygiene News) đã thưc hiện một thử nghiệm dưới hình thức một cuộc thi hàng tháng “Chuyên gia và AI: Phát hiện vấn đề an toàn” (“Pros vs. AI: Spot the Safety Issue” challenge) trên LinkedIn từ tháng 1/2025. Mỗi tháng, ISHN đưa ra một bức ảnh chụp từ thực tế kiểm tra an toàn lao động và mời chuyên gia đánh giá. AI được giao nhiệm vụ tương tự với một lời nhắc (promt): “Tìm tất cả các rủi ro trong bức ảnh này”. ChatGPT được chọn cho đánh giá hàng tháng, vì là một trong những công cụ AI được sử dụng rộng rãi nhất cho các tác vụ liên quan đến công việc tại Hoa Kỳ, đặc biệt là trong môi trường doanh nghiệp.
Trong năm 2025, ISHN đã công bố 11 bức ảnh thể hiện các vi phạm tiêu chuẩn an toàn liên quan đến giàn giáo, thông tin về mối nguy, chống ngã cao, thang, kiểm soát nguồn năng lượng nguy hiểm, không gian hạn chế và che chắn máy móc. Kết quả được tóm tắt như sau:
Những tình huống AI đã làm tốt
– Tháng 6: Tình huống về Khóa/gắn thẻ (LOTO). AI không chỉ xác định được rằng cơ chế khóa hiện tại vẫn cho phép van xoay được, mà còn giải thích chính xác lý do ở việc lựa chọn phương pháp khóa không đúng.
– Tháng 7: AI nhận diện rõ các mối nguy cháy nổ, vấn đề lưu trữ pallet và rác thải hỗn hợp.
– Tháng 9: Với hình ảnh một công nhân đứng trên thang chuẩn bị nâng vật nặng thủ công, AI nhận diện đúng tình huống mối nguy té ngã điển hình.
Trong những trường hợp này, rủi ro có thể “đọc” trực tiếp từ hình ảnh mà không cần diễn giải sâu hơn về bối cảnh hoặc quy định.
Những hạn chế của AI
Nhận dạng đối tượng và các lỗi không gian
Trong hầu hết các tháng, AI liên tục nhận diện sai các đối tượng hoặc vị trí của chúng.Ví dụ:
– Tháng 2: AI xác định các hộp sơn đã bị mở và mối nguy chảy tràn; tuy nhiên dễ thấy chúng vẫn còn nguyên niêm phong.
– Tháng 5: AI cảnh báo về việc vấp ngã do dây cáp trên sàn nhà; người xem thấy các dây cáp được gắn trên tường.
– Tháng 11: AI tuyên bố không có thiết bị bảo vệ mắt; nhưng có thể thấy rõ ràng có tấm chắn mặt.
– Tháng 8: AI đã không nhận ra được một lối vào không gian hạn chế hở trên tường và thay vào đó mô tả nó như một cái lỗ trên sàn nhà có thể bị rơi vào.
Đây không phải là những sai sót nhỏ – chúng trực tiếp làm suy yếu độ tin cậy của việc đánh giá rủi ro.
Lặp lại rủi ro
Việc mô tả lặp lại đã được chứng minh là một trong những lỗi phổ biến nhất của AI. Trong vòng 8 tháng, đã ghi nhận ít nhất 10 trường hợp trong đó cùng một rủi ro cơ bản nhưng đã được AI mô tả nhiều lần bằng các từ ngữ khác nhau.
Ví dụ, ở tháng 10, AI đã liệt kê các vấn đề:
– Các điểm kẹp và mối nguy vướng vào
– Thiếu sự che chắn
– Có biển cảnh báo nhưng không có sự bảo vệ rõ ràng.
Cả ba đã mô tả cùng một rủi ro cốt lõi: tiếp cận các bộ phận chuyển động của băng chuyền.
Nhầm lẫn giữa mối nguy, rủi ro và vi phạm
Một vấn đề mang tính hệ thống khác là khó khăn của AI trong việc phân biệt giữa mối nguy (nguồn gây hại), rủi ro (xác suất và mức độ nghiêm trọng) và vi phạm (không tuân thủ yêu cầu).
Mặc dù thuật ngữ có thể khác nhau, nhưng các chuyên gia an toàn giàu kinh nghiệm luôn phân biệt rõ ràng giữa các khái niệm này khi đánh giá các điều kiện thực tế — một sự phân biệt vẫn còn khó khăn đối với các đánh giá dựa trên AI. Sự nhầm lẫn này đã xuất hiện ít nhất trong 8 tháng đầu của cuộc thi.
Cần lưu ý rằng sự lặp lại hay nhầm lẫn sẽ ảnh hưởng đến kết quả đánh giá. Nhiều hệ thống kiểm toán và chấm điểm sẽ nâng mức độ của các phát hiện dựa trên số lượng vấn đề nhận diện được. Khi AI lặp lại các rủi ro hoặc coi các vi phạm là rủi ro, kết quả có thể bị thổi phồng, có khả năng biến các vấn đề nhỏ thành các phát hiện lớn và làm sai lệch kết quả kiểm toán.
Thiếu khả năng suy luận theo ngữ cảnh
Điểm khác biệt rõ ràng nhất giữa AI và các chuyên gia an toàn giàu kinh nghiệm nằm ở khả năng hiểu bối cảnh. Các chuyên gia thường xác định các mối nguy từ những tín hiệu gián tiếp hoặc không đầy đủ, dựa trên kiến thức về hành vi thực tại nơi làm việc.
Trong thử nghiệm, AI đã không phát hiện ra các mối nguy mà chuyên gia đã phát hiện, ví dụ:
– Tháng 3: Hình ảnh một phần chiếc ủng đặt trên lò sưởi được nhận diện là dấu hiệu cho thấy công nhân đang phơi giày dép – một mối nguy cháy nổ đã được biết rõ.
– Tháng 3: Một cái phễu được đặt vào trong thùng chứa hóa chất cho thấy đây là hình ảnh các lần chuyển hóa chất thường xuyên, chứ không chỉ đơn thuần là lưu trữ.
– Tháng 4: AI mô tả một người thứ hai là “đang đứng ở bậc thang thấp nhất của một chiếc thang”, trong khi các chuyên gia ngay lập tức nhận ra người đó đang giữ thăng bằng cho chiếc thang.
Những kết luận này dựa trên các mô hình hành vi và kinh nghiệm — chứ không chỉ dựa trên việc phát hiện đối tượng.
Cân bằng và bổ sung cho nhau
AI thường nhận diện được nhiều vấn đề riêng lẻ hơn so với người đánh giá. Một phần là do các chuyên gia về HSE giàu kinh nghiệm thường tự động loại bỏ những vấn đề không đáng kể trong quá trình đánh giá rủi ro theo thời gian thực.
Đồng thời, con người cũng không tránh khỏi sai sót. Khi có quá nhiều sai lệch nhỏ, điều quan trọng có thể bị bỏ sót. Theo nghĩa này, AI có thể đóng vai trò như một lớp kiểm tra thứ cấp có giá trị.
Kết luận: thay thế hay tăng cường?
Kết quả thử nghiệm ISHN cho thấy một câu trả lời rõ ràng.
Ngay cả ở cấp độ GPT (Thử nghiệm tổng quát, General Trial Test), AI cũng rất hiệu quả trong việc phát hiện trực quan các mối nguy phổ biến, đã được định nghĩa rõ ràng, đặc biệt là trong các tình huống tĩnh, quen thuộc với dấu hiệu hình học rõ ràng và hậu quả dễ nhận thấy. Nó có thể hỗ trợ phát triển quy trình, làm nổi bật các chi tiết bị bỏ sót và đóng vai trò như một mạng lưới an toàn bổ sung.
Tuy nhiên, AI vẫn còn gặp khó khăn với:
– nhận diện đối tượng chính xác trong các khung cảnh phức tạp
– ưu tiên và hợp nhất các rủi ro
– phân biệt giữa mối nguy và hành vi vi phạm
– và quan trọng nhất là khả năng suy luận theo ngữ cảnh và hành vi.
Công việc về HSE không chỉ đơn thuần là liệt kê những gì có thể nhìn thấy trong một bức ảnh. Nó đòi hỏi phải hiểu cách thức công việc thực sự được vận hành, điều gì thường xảy ra tiếp theo và những rủi ro nào thực sự quan trọng trong thực tế.
AI có thể hỗ trợ. Các chuyên gia HSE đưa ra đánh giá. Hai cái này không thể thay thế cho nhau được, nhưng khi kết hợp với nhau có thể giúp tăng cường đáng kể an toàn tại nơi làm việc.
|
Nguồn:
- https://www.ishn.com/articles/115117-can-artificial-intelligence-replace-an-ehs-professional
- https://www.linkedin.com/pulse/impact-ai-hse-field-trends-challenges-way-forward-lionel-makon-bateki-0ldle
![]()

