Создание простой программы распознавания речи

Если вы фанат Ironman, то наверняка знаете о двух его системах искусственного интеллекта под названием «Jarvis» и «Friday». Тони использует распознавание речи, чтобы отдавать команды своим системам искусственного интеллекта.

Как сделать это в реальном мире, возможно ли это? Ответ — да, возможно. Здесь мы используем python, чтобы сделать программу, которая распознает вашу речь и выводит ее в виде текста. давайте приступим к работе.

требования для этого проекта :

  1. Python 3
  2. модуль распознавания речи Python.

теперь давайте писать.

чтобы установить модель распознавания речи python, введите в терминале следующее

pip install SpeechRecognition
Войти в полноэкранный режим Выйти из полноэкранного режима

и мы используем микрофон в качестве метода ввода. в python для использования микрофона нам нужен другой модуль под названием «Pyaudio». чтобы установить его, введите это в терминале.

pip install PyAudio
Войти в полноэкранный режим Выйти из полноэкранного режима

теперь все готово. нам нужно написать код для создания системы распознавания речи.

Прежде всего, импортируйте все необходимые библиотеки.

import speech_recognition as sr
Войти в полноэкранный режим Выйти из полноэкранного режима

теперь инициализируйте распознаватель.

listener = sr.Recognizer()
Войти в полноэкранный режим Выход из полноэкранного режима

Теперь мы используем обработчик ошибок в случае возникновения ошибки. мы используем try и except.

try:
    with sr.Microphone() as source:
        print('listning...')
        voice = listener.listen(source)
        command = listener.recognize_google(voice)
        print(command)

except:
    pass
Вход в полноэкранный режим Выйти из полноэкранного режима

Теперь давайте разберем все по порядку;

with sr.Microphone() as source:
Вход в полноэкранный режим Выход из полноэкранного режима

это означает, что модель распознавания речи (в начале мы переименовали распознавание речи в «sr») получает микрофон в качестве источника ввода.

print('listning...')
Войти в полноэкранный режим Выход из полноэкранного режима

распечатать текст «listing»

voice = listener.listen(source)
Вход в полноэкранный режим Выход из полноэкранного режима

получить голос пользователя

голос пользователя в качестве ввода через микрофон

command = listener.recognize_google(voice)
Войти в полноэкранный режим Выход из полноэкранного режима

теперь мы передаем голос пользователя в распознаватель речи google, кстати, для этого проекта нам необходимо подключение к интернету.

print(command)
Вход в полноэкранный режим Выйти из полноэкранного режима

теперь распечатаем то, что сказал пользователь

вывод будет выглядеть следующим образом:

PS C:UsersUserDesktoppython practiceai> & "C:/Program Files/Python39/python.exe" "c:/Users/User/Desktop/python practice/ai/speech-recognition.py"
listning...
hello
PS C:UsersUserDesktoppython practiceai> 
Вход в полноэкранный режим Выход из полноэкранного режима

Поздравляю, теперь вы создали свою собственную систему распознавания голоса с помощью python. Если у вас возникнут какие-либо проблемы или ошибки, пожалуйста, сообщите мне об этом. Я с удовольствием помогу вам в этом.

полный код :

import speech_recognition as sr

listener = sr.Recognizer()
try:
    with sr.Microphone() as source:
        print('listning...')
        voice = listener.listen(source)
        command = listener.recognize_google(voice)
        print(command)

except:
    pass
Вход в полноэкранный режим Выход из полноэкранного режима

Оцените статью
devanswers.ru
Добавить комментарий