1. Ngữ điệu học với xử lý ngôn ngữ – Linguistics và language processing

Ngôn ngữ học tập (linguistics) là phân tích và mô tả ngôn từ của con người. Những học thuyết về ngữ pháp cùng ngữ nghĩa đang được cách tân và phát triển từ thời thượng cổ và thời trung cổ.

Bạn đang xem: Hệ thống nhận diện giọng nói và xử lý ngôn ngữ tự nhiên (Speech recognition and natural language processing system)

2. Cỗ kiểm tra chính tả với ngữ pháp – Spelling & grammar checkers

Những chương trình này bây chừ là phổ cập trong các bộ cách xử trí văn bạn dạng như những trong cỗ MS Offices, mở cửa Offices, trong những trình biên soạn thảo của web, v.v và tất cả hàng triệu người tiêu dùng chúng mỗi ngày. Các bộ kiểm tra bao gồm tả vận động dựa trên cơ sở giám sát trên các từ điển với chúng thải trừ đi những từ bị sai chính tả mà xuất hiện thêm trong tài liệu. Bộ soát sổ ngữ pháp sử dụng các luật để tìm ra các kiểu và lỗi ngữ pháp thông dụng (Jensen và cộng sự (1993)).

3. Đánh chỉ mục văn phiên bản và lấy thông tin từ mạng internet – Text indexing và information retrieval from the Internet

Các vận dụng kiểu này rất phổ biến của Web. Chúng dựa trên cơ sở tích lũy việc xịt thăm các site và download các văn phiên bản mà các site cất nó. Việc tích lũy lần theo những đường link trên các trang và vì vậy chúng khám phá các nội dung chứa trong website. Nhiều khối hệ thống này tiến hành việc đánh chỉ mục toàn văn (full text indexing) của tất cả các trang. Lúc đó người sử dụng truy vấn một câu hỏi và các khối hệ thống lấy lại được ngôn từ trả về từ bỏ các showroom internet của các tài liệu chứa những từ của câu truy hỏi vấn. Những thống kê sử dụng các từ cùng đo mức độ phổ biến, các hệ thống rất có thể xếp được sản phẩm hạng những tài liệu (Brin và Page 1998; Salton 1988).

4. Ghi chép từ tiếng nói – Speech transcription

Những lịch trình này dựa trên nhận biến hóa lời nói. Nắm vì chúng ta phải áp dụng bàn phím nhằm gõ vào, các hệ thống này cho phép người thực hiện ra lệnh bằng giọng nói cùng chúng sẽ tiến hành sao chép auto thành văn bản, như khối hệ thống Microsoft Windows Speech Recognition hoặc Voice tìm kiếm của Google có hiệu quả khá cao và phân biệt được những ngôn ngữ tiếng Anh, Pháp, Đức, Nhật, Trung Quốc, v.v, và giờ cung cấp cả ngôn từ Việt nam. Một vài ba hệ thống hoàn toàn có thể ghi chép lại các chương trình radio và những chương trình tin tức TV với tỉ lệ lỗi các từ bé dại hơn 10% (Nguyen và cộng sự 2004).

5. Điều khiển bằng giọng nói cho những thiết bị mái ấm gia đình – Voice control of domestic devices

Hiện nay, bài toán xây dựng thành phố thông minh, ngôi thông nhà mình đang được đun sôi từng ngày với các ứng dụng và tự động hóa – ví như người sử dụng hoàn toàn có thể lên lịch mang đến một cái đèn thông minh nhằm bật vào lúc hoàng hôn, hoặc sử dụng điện thoại của người sử dụng để tắt nó sau khi chúng ta lên giường. Nhưng điều gì sẽ xảy ra nếu chúng ta có thể đơn giản nói cùng với ngôi nhà thông minh của chính bản thân mình tắt nó đi?

Những tiến bộ vừa mới đây trong technology nhận dạng giọng nói và xử trí ngôn ngữ tự nhiên đã tạo cho một ngôi thông nhà minh được tinh chỉnh bằng tiếng nói hoàn toàn có thể đạt được, cùng nhiều phầm mềm hứa hẹn đã hoàn thành quá trình đã có sẵn.

6. Những ứng dụng liên can giọng nói – Interactive voice response applications

Các ựng dụng hệ trọng giọng nói (IVR) là một trong những công nghệ cho phép máy tính tác động với con người trải qua việc áp dụng giọng nói và âm nhạc DTMF nhập qua bàn phím. Vào viễn thông, IVR có thể chấp nhận được khách hàng ảnh hưởng với khối hệ thống máy chủ của doanh nghiệp thông qua bàn phím điện thoại cảm ứng thông minh hoặc bằng nhận dạng giọng nói, sau đó hoàn toàn có thể tìm hiểu các dịch vụ thông qua đối thoại IVR. Các hệ thống IVR có thể phản hồi với âm nhạc được ghi trước hoặc được chế tạo ra động để người dùng thực hiện tại theo các chỉ dẫn của hệ thống.

Các khối hệ thống IVR được tiến hành với khối hệ thống có số lượng cuộc gọi béo và cũng khá được sử dụng để call đi, vì hệ thống IVR thông minh hơn nhiều khối hệ thống quay số dự đoán.

7. Dịch thiết bị – Machine translation

Nghiên cứu về dịch máy là 1 trong những lĩnh vực lâu đời nhất trong xử trí ngôn ngữ. 1 trong những những kết quả là hệ thống SYSTRAN mà ban sơ dịch thân tiếng Anh với tiếng Nga cho bộ quốc phòng Mỹ. Ngày nay, dịch máy vẫn được mở rộng cho nhiều ngôn ngữ khác và đã trở thành một ứng dụng chủ yếu trong xử lý ngôn từ tự nhiên: Google Translate hiện nay tại cung ứng hơn 60 ngôn ngữ và được sử dụng hơn 200 triệu người mỗi tháng (Och 2012). Fan người đi đón đầu trong nghành nghề dịch vụ này là Spoken Language Translator mà được dịch từ ngôn ngữ nói giờ đồng hồ Anh lịch sự ngông ngữ Thuỵ điển trong nghành giới hạn về thời gian thực (Agnäs cộng sự 1994; Rayner và tập sự 2000)

8. Đàm thoại tự động hóa – Conversational agents

Là một khối hệ thống hội thoại (Dialogue System) bằng việc khối hệ thống sẽ liên tưởng với con người thông qua việc xử trí ngôn ngữ tự nhiên và sẽ tự động trả lời bằng ngôn từ của bé người. Các tác nhân này đại diện cho việc triển khai thực tiễn các ngôn từ học tính toán, hay được thực hiện làm chatbot qua mạng internet hoặc làm cho trợ lý thiết bị cầm tay. Sự liên hệ giải thích/phản hồi này rất có thể thực hồi bằng nhiều hiệ tượng khác nhau, ko chỉ đơn giản và dễ dàng là văn bản.

Hệ thống hội thoại cũng có thể đọc từ (kênh đầu vào) và phản hồi bằng lời nói (kênh đầu ra), vật họa, động tác ảo hoặc động tác cử chỉ vật lý.

9. Hỏi đáp – Question answering

Các hệ thống hỏi đáp khắc ghi cột một của chính bản thân mình vào năm 2011 khi hệ thống IBM Watson tranh tài trên truyền họa trong chương trình có tên Jeopardy! để thử nghiệm kỹ năng của nó (Ferrucci 2012). Các câu hỏi đáp của Watson đề cập trong vô số nhiều lĩnh vực, sử dụng trí thức là ngôn ngữ thoải mái và tự nhiên được trích xuất từ Wikipedia và những nguồn dữ liệu gốc, những bách khoa toàn thư, các từ điển với cả đông đảo cơ sở tài liệu như Word
Net, DPedia và Yago (Fan và tập sự 2012).

Một vài ứng dụng của xử lý ngữ điệu ngày càng được sử dụng phổ cập như bộ kiểm tra thiết yếu tả với ngữ pháp. Một cố những khái hiện tại vẫn chưa sẵn sàng cho khai quật công nghiệp hoặc vẫn quá đắt cho áp dụng đại trà. Không giống như các chương trình máy vi tính khác, công dụng của những kỹ thuật xử lý ngữ điệu hiếm khi đã đạt được tỉ lệ thành công xuất sắc 100%, như khối hệ thống nhận biết giọng nói là một trong những ví dụ. Các kỹ thuật xử lý ngữ điệu đạt được độ chín và có thể sử dụng được khi chúng chuyển động với độ đúng chuẩn nhất định và với bỏ ra phí đồng ý được. Tuy vậy thường các kỹ thuật này vẫn vẫn tiếp tục đổi mới và chúng thay đổi khá nhanh theo cách tương tác của họ với vật dụng tính.

Trong xử lý ngữ điệu tự nhiên, việc trong việc tương tác giữa tín đồ và sản phẩm móc luôn luôn được vồ cập đặc biệt. Một khối hệ thống đối thoại qua tiếng nói (Spoken Dialog System) là một khối hệ thống máy tính có công dụng giao tiếp cùng với một người qua giọng nói. SDS bao gồm 2 thành phần chính mà không có trong một khối hệ thống đối thoại qua văn bản:

Một bộ nhận dạng lời nói.Một mô-đun chuyển từ văn bản đến lời nói.

Một trong số những thách thức đặc biệt quan trọng nhất phải đương đầu trong SDS là vụ việc hiểu được lời nói. Lúc đó, khối hệ thống nhận dạng lời nói tự động (ASR) đang tham gia vào dịch tín hiệu lời nói thành một tập hầu hết lệnh nhưng hệ thống hoàn toàn có thể hiểu được.

*

T với t từ 1 đến T. Tiếp theo, bộ giải mã có được đều chuỗi từ links với các thay mặt âm thanh được cung cấp. Quy trình giải mã được thực hiện bởi quy tắc quyết định của Bayes , chỉ dẫn trong phương trình (1):

*

*

Hệ thống ASR dùng quy mô ngôn ngữ (Language model _ LM) để thâu tóm cách kết hợp của theo từ vào một ngữ điệu cụ thể. Ngày nay, những quy mô ngôn ngữ thống kê lại được thực hiện rộng rãi trong số những hệ thống ASR; những quy mô ngôn ngữ n-gram theo từ là phương pháp được sử dụng thoáng rộng nhất cũng chính vì hiệu quả trong bài toán giảm tỷ lệ lỗi từ (WER). Tuy nhiên, khi thao tác với ứng dụng hạn chế về con số tài liệu huấn luyện và đào tạo có sẵn giống như những nhiệm vụ rõ ràng trong những khối hệ thống đối thoại, sự khan hãn hữu của dữ liệu trở thành một vụ việc và lúc ấy một phương thức thay thế, như một mô hình ngôn ngữ n-gram theo lớp rất có thể được sử dụng. Rộng nữa, lấy ví dụ như một ứng dụng khối hệ thống đối thoại được cài đặt trong 1 robot, luôn có vốn phần đông từ vựng miền ràng buộc phù hợp cho câu hỏi phân loại. Đây là các loại mô hình hoàn toàn có thể được không ngừng mở rộng từ quy mô ngôn ngữ dựa trên cụm từ. Chúng ta đề xuất áp dụng một quy mô ngôn ngữ mở rộng ví dụ trong phân các loại ngữ nghĩa để nâng cao nhận biết khẩu ca và tỷ lệ hiểu.

Xem thêm: Hướng Dẫn Sử Dụng Nồi Cơm Điện Tiger Nội Địa, Hướng Dẫn Sử Dụng Nồi Cơm Điện Tiger

Mặt khác, những khối hệ thống ASR được quản lý để đạt hiệu suất tốt lúc trong một môi trường thiên nhiên sử dụng được kiểm soát và cùng với một người dùng hợp tác. Mặc dù nhiên, tỷ lệ đúng mực của chúng sút khi bỏ những điều kiện này hoặc tất cả sự không tương xứng âm thanh giữa tài liệu thử nghiệm và tài liệu đào tạo. Đây là trường hợp với một robot được cung cấp một khối hệ thống đối thoại để tương tác với bé người. Nó rất có thể sẽ thao tác trong một môi trường xung quanh ồn ào nơi những người dân dùng cố gắng lấy thông tin về một số vấn đề. Để xử lý những vụ việc này, thực hiện AM rất có thể giảm các thay đổi trong biểu đạt tiếng nói với thu được một tập những mô hình và chuyên môn cho toàn bộ các nguồn biến đổi trong lời nói. Tò mò việc thực hiện một kế hoạch thích ứng với những người nói trong tính năng của hệ thống ASR, mê say ứng bạn nói được ao ước muốn đặc biệt trong trường hợp có rất nhiều những tương tác tiếng nói được tái diễn với một trong những lượng những người tiêu dùng giới hạn, lấy một ví dụ một khối hệ thống hoặc robot giúp vấn đề nhà.Phần tiếp theo của nội dung bài viết sẽ đưa bọn họ đến tư tưởng về mô hình ngôn ngữ (LM) và gửi ra một trong những thí nghiệm cho thấy những cải tiến liên quan lại tới việc thực hiện các mô hình này trong hệ thống ASR.