Đang xử lý.....

DỊCH VỤ CÔNG QUA TRỢ LÝ ẢO VÀ GIỌNG NÓI: TƯƠNG LAI GIAO TIẾP GIỮA CHÍNH PHỦ VÀ CÔNG DÂN  

Trong kỷ nguyên chuyển đổi số, phương thức tương tác giữa Chính phủ và người dân đang thay đổi nhanh chóng, từ mô hình “một cửa điện tử” sang “dịch vụ công mọi lúc – mọi nơi – mọi phương thức”. Một trong những xu hướng nổi bật nhất của giai đoạn này là sự xuất hiện của trợ lý ảo và công nghệ xử lý giọng nói (Voice User Interface – VUI) trong thực hiện thủ tục hành chính (TTHC). Nếu như trước đây người dân phải trực tiếp đến cơ quan công quyền, gửi văn bản hoặc thao tác thủ công trên Cổng dịch vụ công trực tuyến, thì tương lai đang mở ra kịch bản hoàn toàn mới: công dân chỉ cần nói chuyện với chính phủ bằng giọng nói tự nhiên, thông qua điện thoại, loa thông minh, tổng đài ảo hoặc ứng dụng trợ lý giọng nói. Những công nghệ này hứa hẹn thay đổi căn bản cách thức cung cấp dịch
Thứ Hai, 01/12/2025 39
|

Mở đầu: Giọng nói – kênh giao tiếp mới của Chính phủ số

Trong kỷ nguyên chuyển đổi số, phương thức tương tác giữa Chính phủ và người dân đang thay đổi nhanh chóng, từ mô hình “một cửa điện tử” sang “dịch vụ công mọi lúc – mọi nơi – mọi phương thức”. Một trong những xu hướng nổi bật nhất của giai đoạn này là sự xuất hiện của trợ lý ảo và công nghệ xử lý giọng nói (Voice User Interface – VUI) trong thực hiện thủ tục hành chính (TTHC). Nếu như trước đây người dân phải trực tiếp đến cơ quan công quyền, gửi văn bản hoặc thao tác thủ công trên Cổng dịch vụ công trực tuyến, thì tương lai đang mở ra kịch bản hoàn toàn mới: công dân chỉ cần nói chuyện với chính phủ bằng giọng nói tự nhiên, thông qua điện thoại, loa thông minh, tổng đài ảo hoặc ứng dụng trợ lý giọng nói. Những công nghệ này hứa hẹn thay đổi căn bản cách thức cung cấp dịch vụ công, giúp người dân tiếp cận thông tin công, đăng ký thủ tục và nhận hỗ trợ theo cách đơn giản nhất, đặc biệt đối với nhóm người yếu thế như người cao tuổi, người mù chữ, người khuyết tật hoặc người dân ở vùng xa hạn chế kỹ năng số.

Không chỉ mang lại trải nghiệm thuận tiện, trợ lý ảo giọng nói còn giúp các cơ quan nhà nước giảm tải chi phí vận hành, chuẩn hóa quy trình hỗ trợ người dân và đảm bảo công bằng trong tiếp cận dịch vụ công. Sự phát triển mạnh mẽ của AI tạo sinh, công nghệ nhận dạng giọng nói tiếng Việt (ASR) và tổng hợp giọng nói (TTS) làm cho các mô hình voicebot của Chính phủ ngày càng khả thi. Trên thế giới, nhiều quốc gia đã triển khai mô hình tổng đài AI, trợ lý giọng nói cho dịch vụ công và thu được kết quả tích cực. Điều này đặt ra yêu cầu cấp thiết cho Việt Nam trong việc nghiên cứu cơ chế vận hành, bài học kỹ thuật – quản trị, và cách truyền thông phù hợp để chuẩn bị cho sự xuất hiện của hệ sinh thái dịch vụ công sử dụng kênh giọng nói.

Xu hướng toàn cầu: Từ giao diện màn hình sang giao diện giọng nói

Trên phạm vi quốc tế, VUI đã trở thành xu hướng công nghệ dẫn dắt trong cung cấp dịch vụ công và dịch vụ công ích. Sự phổ biến của loa thông minh như Amazon Echo, Google Home cùng hệ sinh thái trợ lý ảo đã tạo thói quen giao tiếp bằng giọng nói trong đời sống hàng ngày. Chính phủ các nước nhận thấy người dân, đặc biệt là người có hạn chế về kỹ năng số, dễ tiếp cận với thao tác “nói” hơn “gõ – đọc – thao tác” nên đã chủ động phát triển voicebot trong dịch vụ công.

Ở Mỹ, gần 40 bang triển khai tổng đài tự động hỗ trợ người dân tra cứu dịch vụ xã hội, thuế, việc làm hoặc thông tin y tế. Ở Ấn Độ, voicebot được dùng để hỗ trợ hàng trăm triệu người dân nông thôn trong chương trình Digital India với kỳ vọng vượt qua rào cản mù chữ. Các tổ chức quốc tế như OECD, World Bank và UNDP gần đây đều thúc đẩy xu hướng “conversational government” – chính phủ hội thoại – dựa trên AI và công nghệ giọng nói. Như vậy, việc thay đổi kênh tiếp nhận và cung cấp dịch vụ công từ “web-based” sang “voice-based” không chỉ là xu hướng công nghệ mà còn là một thay đổi mang tính chính sách.

Sự dịch chuyển này diễn ra mạnh mẽ vì VUI mang lại những ưu điểm vượt trội: thao tác dễ hơn, phù hợp đa dạng đối tượng; tốc độ tương tác nhanh; có thể hoạt động trên thiết bị phổ thông như điện thoại phím bấm hoặc điện thoại nghe gọi thông thường; hỗ trợ tốt cho tình huống khẩn cấp; và có thể mở rộng linh hoạt mà không cần đầu tư nhiều hạ tầng vật lý. Đặc biệt, trong bối cảnh di cư số, lao động làm việc từ xa, người già và người yếu thế cần kênh hỗ trợ không đòi hỏi kỹ năng công nghệ cao, voicebot trở thành giải pháp dân chủ hóa tiếp cận dịch vụ công. Những quốc gia thành công đều có điểm chung: tích hợp một trung tâm dữ liệu lớn, chuẩn hóa danh mục câu hỏi – câu trả lời, tự động hóa quy trình và áp dụng AI để nâng chất lượng hội thoại.

Truyền thông về tương lai làm TTHC bằng giọng nói: Xây dựng niềm tin cho người dân

Việc đưa voicebot vào dịch vụ công không chỉ là câu chuyện công nghệ mà còn là quá trình truyền thông thay đổi thói quen xã hội. Người dân phải hiểu rõ rằng việc “nói chuyện với Chính phủ” không chỉ để hỏi thông tin mà hoàn toàn có thể thực hiện thủ tục như đăng ký hồ sơ, tra cứu kết quả hoặc phản ánh kiến nghị. Để đạt được điều đó, truyền thông đóng vai trò trung tâm trong việc định hình niềm tin xã hội, tạo dựng nhận thức chính xác và phòng ngừa sự hoài nghi. Nhiều quốc gia đã triển khai chiến dịch truyền thông rộng rãi về “government voice services”, quảng bá tính năng của trợ lý ảo như chính xác, bảo mật, tiện lợi, có giám sát của con người và hoàn toàn miễn phí.

Một trong những nội dung quan trọng nhất của truyền thông là giải thích về bảo mật giọng nói, quyền riêng tư và cách chính phủ xử lý dữ liệu. Người dân đặc biệt quan tâm liệu giọng nói của họ có bị lưu lại, có bị phân tích trái phép hay bị dùng cho mục đích thương mại không. Chính phủ cần công bố rõ ràng các cơ chế bảo mật, chuẩn mã hóa, quy trình ẩn danh dữ liệu và khẳng định voicebot chỉ là “kênh mới” của dịch vụ công chứ không thay thế con người. Bên cạnh đó, truyền thông phải hướng tới việc xây dựng niềm tin với nhóm yếu thế: người cao tuổi, người ít dùng smartphone, người lao động xa quê… để họ sẵn sàng sử dụng kênh giọng nói thay vì lo ngại rằng đây là công nghệ phức tạp. Cuối cùng, truyền thông phải dựa trên phương châm minh bạch, chủ động và liên tục để hình thành chuẩn mực xã hội mới về tương tác số với chính quyền.

Kinh nghiệm từ Mỹ: Voicebot hỗ trợ khối lượng lớn người dân

Hoa Kỳ là một trong những quốc gia tiên phong sử dụng voicebot trong dịch vụ công, đặc biệt tại các bang có dân số đông hoặc các lĩnh vực cần tương tác thường xuyên như thuế, bảo hiểm thất nghiệp, thông tin y tế và các chương trình phúc lợi. Trong đại dịch COVID-19, bang New York triển khai voicebot tự động trả lời 100.000 cuộc gọi mỗi ngày liên quan đến trợ cấp thất nghiệp. Voicebot xử lý các bước như: khai báo thông tin, hướng dẫn nộp hồ sơ, giải thích tiến độ xử lý và cảnh báo về các thủ tục giả mạo. Bang California sử dụng callbot AI hỗ trợ hồ sơ tiêm chủng, giúp giảm 70% tải của tổng đài viên. Các callbot này được huấn luyện bằng kho dữ liệu câu hỏi thường gặp (FAQ) của từng chương trình công, đồng thời tích hợp AI để phân tích ngôn ngữ tự nhiên, giúp hiểu được yêu cầu của người dân ngay cả khi họ nói nhanh, nói sai ngữ pháp hoặc dùng ngôn ngữ địa phương.

Tại cấp liên bang, Cơ quan Thuế vụ Hoa Kỳ (IRS) triển khai voicebot hỗ trợ thanh toán thuế, tra cứu nợ thuế và cài đặt lịch trả góp. Đây là bước tiến quan trọng vì trước đây IRS vốn nổi tiếng quá tải trong mùa khai thuế. Voicebot giúp hàng triệu người dân không phải chờ hàng giờ để gặp tổng đài viên. Kinh nghiệm của Mỹ cho thấy rằng: (i) voicebot hiệu quả nhất khi được tích hợp vào hệ thống dữ liệu tập trung; (ii) cần có quy trình chuyển tiếp mượt mà từ AI sang nhân viên hỗ trợ thật; và (iii) cần cơ chế phản hồi liên tục để cải thiện mô hình theo nhu cầu thực tế. Những bài học này rất phù hợp cho Việt Nam khi triển khai voicebot liên quan đến thuế, BHXH, bảo trợ xã hội và các dịch vụ có tần suất hỏi – đáp lớn.

Kinh nghiệm từ Ấn Độ: Voicebot giúp xóa rào cản mù chữ và tiếp cận số

Ấn Độ là mô hình đặc biệt bởi hơn 30% dân số có trình độ đọc viết thấp và phần lớn người dân ở nông thôn không quen sử dụng dịch vụ công trực tuyến truyền thống. Để giải quyết điều này, Chính phủ Ấn Độ phát triển các nền tảng voicebot như Bhashini, Umang Voice và DigiStack Voice Interface. Các hệ thống này cho phép người dân chỉ cần dùng điện thoại phổ thông để gọi và nói bằng ngôn ngữ mẹ đẻ, hệ thống tự nhận dạng giọng nói Ấn Độ, dịch sang tiếng Anh, xử lý yêu cầu rồi trả lời bằng giọng nói đã chuyển dịch. Điều này vượt qua rào cản lớn về kỹ năng số, đặc biệt trong các lĩnh vực như đăng ký phúc lợi xã hội, truy vấn thông tin nông nghiệp, hướng dẫn chăm sóc sức khỏe và khai báo nhu cầu trợ cấp.

Một thành công nổi bật của Ấn Độ là mô hình “conversational governance” – chính quyền giao tiếp bằng hội thoại với công dân. Người dân chỉ cần nói: “Tôi muốn đăng ký hỗ trợ mùa màng mùa khô năm nay” hoặc “Tôi muốn theo dõi hồ sơ trợ cấp y tế”, voicebot sẽ tự động đọc thông tin, kiểm tra cơ sở dữ liệu quốc gia và hướng dẫn từng bước. Nhờ đó, hàng chục triệu người dân tham gia các chương trình phúc lợi mà trước đây họ không thể tiếp cận. Bài học từ Ấn Độ cho thấy: voicebot không chỉ giúp hiện đại hóa chính phủ mà còn là công cụ bình đẳng hóa dịch vụ công, đặc biệt hiệu quả trong quốc gia có dân số lớn và đa ngôn ngữ.

Thách thức lớn khi triển khai dịch vụ công qua giọng nói

Dù tiềm năng lớn, voicebot trong dịch vụ công cũng đi kèm nhiều thách thức. Thách thức đầu tiên là độ chính xác của nhận dạng giọng nói, đặc biệt với ngôn ngữ có thanh điệu như tiếng Việt, các phương ngữ nặng hoặc môi trường gọi điện nhiễu. Thứ hai là bảo mật dữ liệu giọng nói – loại dữ liệu sinh trắc học rất nhạy cảm. Chính phủ cần cơ chế mã hóa, ẩn danh hóa, xác thực an toàn và cơ chế xin phép người dùng rõ ràng. Thứ ba, nhiều quy trình thủ tục hiện nay yêu cầu biểu mẫu phức tạp hoặc đính kèm tài liệu – điều này đặt ra khó khăn khi chuyển sang giao diện giọng nói. Thứ tư, voicebot có thể gây bức xúc nếu người dân cảm thấy khó tương tác, hệ thống lặp lại nhiều lần hoặc không hiểu yêu cầu. Do đó, cần thiết kế quy trình chuyển sang tổng đài viên thật một cách trơn tru.

Ngoài ra, thách thức về niềm tin xã hội cũng quan trọng. Người dân thường lo ngại bị lừa đảo qua cuộc gọi mạo danh, nên việc phân biệt giữa callbot chính thức và cuộc gọi giả mạo là yếu tố quyết định. Chính phủ phải tổ chức chiến dịch truyền thông mạnh mẽ để người dân biết số tổng đài, kênh chính thức, phương thức xác thực và cảnh báo lừa đảo. Cuối cùng, việc triển khai voicebot quy mô lớn đòi hỏi hạ tầng dữ liệu dùng chung, chuẩn hóa danh mục dịch vụ và tự động hóa quy trình nội bộ – những điều kiện không phải địa phương nào cũng sẵn sàng.

Định hướng cho Việt Nam: Xây dựng Chính phủ hội thoại (Conversational Government)

Để triển khai dịch vụ công trên nền tảng giọng nói, Việt Nam cần có chiến lược tổng thể, nhất là trong bối cảnh đang thúc đẩy Chính phủ số và chuyển đổi thủ tục hành chính. Một định hướng quan trọng là xây dựng Trung tâm trợ lý ảo dịch vụ công quốc gia, tích hợp cơ sở dữ liệu quốc gia về dân cư, bảo hiểm, đất đai, thuế và các hệ thống xử lý nội bộ của bộ ngành. Từ trung tâm này, Chính phủ có thể tạo ra voicebot cho từng lĩnh vực: bảo hiểm y tế, thuế, giáo dục, việc làm, phúc lợi xã hội, phản ánh hiện trường.

Việt Nam có lợi thế lớn khi sở hữu hệ thống tổng đài hành chính công của các tỉnh, trong đó nhiều nơi đã vận hành 1022, 1023 hoặc các hotline chuyên ngành. Những tổng đài này có thể được nâng cấp bằng AI để hình thành callbot bán tự động, giúp giảm gánh nặng cho tổng đài viên. Bên cạnh đó, định hướng về truyền thông cần tập trung xây dựng nhận thức rằng việc sử dụng giọng nói chỉ là “cách làm mới” chứ không thay đổi bản chất thủ tục; đảm bảo rằng voicebot không làm người dân cảm thấy xa cách mà ngược lại, mang đến trải nghiệm thân thiện và người dân luôn có lựa chọn gặp nhân viên thật khi cần.

Kết luận: Giọng nói – cầu nối mới giữa Nhà nước và công dân

Dịch vụ công qua trợ lý ảo và giọng nói là bước tiến tất yếu trong hành trình chuyển đổi sang Chính phủ số. Nó không chỉ đơn thuần là nâng cấp công nghệ mà còn mở ra mô hình giao tiếp công hoàn toàn mới – một mô hình mang tính bao trùm, bình đẳng và hướng tới phục vụ mọi nhóm công dân, kể cả người yếu thế. Kinh nghiệm từ Mỹ và Ấn Độ cho thấy voicebot có thể xử lý khối lượng lớn yêu cầu, giảm chi phí, tăng sự hài lòng của người dân và mở rộng khả năng tiếp cận dịch vụ công.

Đối với Việt Nam, đây là thời điểm thích hợp để xây dựng nền móng cho “Chính phủ hội thoại”, trong đó giọng nói trở thành kênh giao tiếp chính thức và hiệu quả. Khi được triển khai đúng cách – kết hợp công nghệ, dữ liệu, pháp lý và truyền thông – voicebot sẽ trở thành công cụ mạnh mẽ giúp Việt Nam tiến gần hơn tới mục tiêu Chính phủ số lấy người dân làm trung tâm.

Trần Thị Duyên

Tài liệu tham khảo

https://www.gao.gov/products/gao-23-106811

https://dic.gov.in/umang/

 

Thống kê truy cập
  • Đang truy cập: 206
    • Khách Khách 206
    • Thành viên Thành viên 0
    • Tổng lượt truy cập Tổng
    • Tổng số lượt truy cập: 5546123