способ для тех, у кого видосы на 4гб+:
заходим сюда -
ТЫК
входим в акк гугл если попросят
создаем новый файл коллаба
подключаем гугл диск, где уже будет залито ваше видео с ромой ханиевым на 15 гб (нажимаем слева кнопку файлы, потом там будет кнопочка "подключить диск")
нажимаем слева сверху
+ Код
пишем в появившуюся строку "
!pip install -U openai-whisper" (без кавычек конечно)
жмем кнопку плей слева от окошка с кодом и ждем пока выполнится - должно быть написано в конце что то типа "Successfully installed openai-whisper-20231117 tiktoken-0.5.2"
опять жмем + код и пишем "
import whisper", ждем выполнения
+ код, копируем
path = "/content/drive/MyDrive/C2663.MP4" # нажимаем три точки справа от вашего файла в директории, жмем "скопировать путь" и вставляем сюда так же в кавычки
model = whisper.load_model("medium") # есть tiny, base, small, medium, large (рекомендую small или medium), от этого параметра зависит скорость и качество
task = "transcribe"
source_language = "english" # сюда пишем язык, который нужно распознать в видео
result_trans = model.transcribe(path, task=task, language=source_language)
print(result_trans["text"])
запускаем
ниже появится текст расшифровки видео
кайфуем