Ngày 15 tháng 2, Hội đồng Nghiệm thu Đề tài cấp ĐHQG-HCM đã tiến hành họp đánh giá và nghiệm thu đề tài “Nghiên cứu và xây dựng hệ thống nhận diện tên thuốc tên đơn thuốc bản in dựa trên mạng nơ-ron tích chập” tại trường Đại học Khoa học tự nhiên, ĐHQG-HCM. Đề tài trên được thực hiện bởi TS. Nguyễn Ngọc Thảo (chủ nhiệm) và TS. Lê Ngọc Thành (thành viên).

Trong lĩnh vực y tế, việc nhận dạng và trích xuất thông tin từ đơn thuốc là một nhu cầu thiết yếu. Tuy nhiên, các phương pháp hiện tại vẫn còn tồn tại nhiều hạn chế về độ chính xác và tốc độ xử lý, đặc biệt là khi xử lý các đơn thuốc được chụp qua smartphone với độ nghiêng và độ phân giải không đồng đều.
Nội dung và Phương pháp Nghiên cứu
Mục tiêu chính của đề tài là nhận dạng và trích xuất thông tin từ đơn thuốc nhằm mục đích quản lý thông tin y tế và đảm bảo an toàn cho bệnh nhân. Việc này giúp giảm thiểu sai sót trong điều trị và hỗ trợ nhà thuốc, bệnh viện lưu trữ, sử dụng thông tin thuốc chính xác.
Các nghiên cứu trước đây đã tiếp cận bài toán này bằng cách sử dụng các mô hình nhận dạng ký tự quang học (OCR) kinh điển và một số mô hình học sâu như CNN để nhận dạng văn bản trên đơn. Tuy nhiên, các phương pháp này thường gặp khó khăn trong việc xử lý ảnh chụp có chất lượng kém, văn bản bị nghiêng hoặc lệch, dẫn đến độ chính xác không cao và tốc độ xử lý chậm. Do đó, nhóm nghiên cứu đề xuất một mô hình mới sử dụng mạng TCN kết hợp với các quy tắc heuristic để cải thiện độ chính xác và tốc độ xử lý.
Hệ thống áp dụng nhiều công nghệ tiên tiến, bao gồm: (1) CRAFT để phát hiện vùng văn bản, (2) VietOCR để nhận dạng văn bản, (3) biểu thức chính quy và hậu xử lý OCR để trích xuất tên thuốc, và (4) mô hình TCN để phân loại và xác thực thông tin thuốc.

Kết quả Nghiên cứu và Ứng dụng
Hệ thống MEP đạt được độ chính xác 0.94, cải thiện so với các phương pháp trước. Tốc độ xử lý trung bình 6.67 giây mỗi đơn thuốc, nhanh hơn mô hình cũ (17.81 giây). Hệ thống có khả năng nhận dạng văn bản tốt hơn trên ảnh đơn thuốc có chất lượng kém.
Những cải tiến này không chỉ thể hiện qua độ chính xác cao hơn trong việc trích xuất tên thuốc mà còn qua khả năng xử lý nhanh chóng, hiệu quả, đáp ứng tốt nhu cầu thực tế trong quản lý thông tin y tế.
Bên cạnh kết quả nghiên cứu, nhóm thực hiện còn đạt được một số thành tựu đáng chú ý, bao gồm việc công bố một bài báo tại hội nghị hạng B theo CORE2023 và hướng dẫn thành công 06 sinh viên bảo vệ thực tập dự án tốt nghiệp, trong đó có 05 sinh viên đã hoàn thành và tốt nghiệp.
Minh Tâm