Обновлённая версия:
Очень-очень-очень-очень-очень маленький слон долго делал статью, а видео ещё дольше! Много сил на это всё ушло. Я бы сравнил с разработкой игр. Эти 20 минут теперь занимают у меня на диске гигабайт 15.
Использовал DaVinci Resolve, Photoshop, Blender и музыку из suno. Не было сил более терпеть ДаВинчи — часто падал, пару выделывал выкрутасы. Иногда пропадал звук.
- 07 мая 2024, 21:10
- 010
Текстовая версия (если кто не знает как найти): https://gamin.me/posts/22584
Как же это качественно и профессионально смотрится! Сразу понятно, почему ушло столько времени. Всё проиллюстрировано, всё проанимировано, даже не хочется слушать фоном, потому что на экране постоянно что-то интересное происходит.
И чёрт, какой же неразборчивый этот робоголос! (>﹏<)
Тут скорее ... вот это вот:
:yak:
Ну я старался, пытался. Может быть это я уже так привык, а может наушники у меня такие. А может быть у меня есть слух (да не, берд какой-то)!?
Почему бы и нет! Но всё же насколько я знаю, это относится к музыкальному слуху, а не к тому, насколько тебе тихими или громкими кажутся звуки. Даже диапазон частот, к которым чувствительны твои уши, сюда не входит.
Видеоряд выглядит круто.
Но речь не очень разборчивая. Пробуй говорить медленнее, чётче и не так отрывисто. У меня точно такая же проблема, если что =)
Зачем фильтр на начитке? В итоге неразборчиво. Робоголос можно тогда было сделать вообще без своего голоса. А в данном случае хотя бы субтитры поставить.
Ясно, видео не открывал
Изначально я и думал взять обычный робо-голос. ну ладно
Вообще-то с пару минут посмотрел, часть сказанного не разобрал, закрыл.
а надо было нажать на иконку субтитров
Понятно. Ну, значит, я тебя недооценил. Можно было и не скрывать видео, это как-то радикально, а в названии просто написать (sub), например.
Зачем писать в названии sub если там есть аудио. И по дефолту показывается иконка, что есть субтитры. Я не виноват, что пользователи не умеют пользоваться субтитрами.
Да что ж тебя так бомбит-то? Все норм. Вроде никто не тут оскорблений и т.п. Удачи.
В смысле бомбит? Ты открывающим комментом написал, что "хотя бы субтитры поставить", что подразумевает словно их нет. А они есть, только надо быть внимательнее. И это не только к конкретному видео относится, но даже к играм — пользователи разучились пользоваться.
Вот это основное.
А титры я имел в виду "встроенные" с каким-то подходящим шрифтом. Сам всю жизнь такие делал, поскольку ютуб не единственная площадка на свете. Да, на наличие ютубных субтитров не глянул, но качество твоего видео не оставило мне выбора, кроме как закрыть его.
Такие я ещё не научился делать
Ого, ДД решил бить тяжёлой артиллерией! *__*
Появилась улучшенная версия
В чём улучшение? Или это мета-форум-игра "найди 10 отличий"?
Я бы сказал, что произошло "улучшение в стиле Хейзера" -_-
PS: А ну верни робота, ДаркДес!!!
Это супер глупое предложение, но если ты прям совсем не хочешь оставлять свой голос, и при этом тебя не смутит повествование от мужского лица женским голосом, или если ты сумеешь роботизировать женский голос так, чтобы он зазвучал мужским, то я готова начитать для тебя текст статьи.
это мета, но не игра
Это смешно конечно, но лучше фильтр убрал и норм сделал голос (я понимаю, что у тебя возможно мало опыта, возможно ты стесняешься, может у тебя дефекты в речи (лол, посмотри мои видосы), возможно тебе не нравится свой голос и ты считаешь его мерзким (лол, посмотри мои видосы 2). Уверенность придет только с опытом, и маскировать ее отсутствие робовойсом не очень).
Учитывай, что многие люди смотрят видео на ютубе на скорости больше чем 1х. Если на 1х твой робовойс еще как-то различим, то на 2х, уже крайне сложно понять, что ты говоришь. Я же смотрю видео на 2.5х. Очень полезно в давинчи слушать видосы на 2х. На клаве два раза L нажимаешь.
Я б на твоем месте удалил оба видоса и переделал звук в первом. Поверь, такое видео тебе больше просмотров в итоге принесет. Пока канал маленький, это делать безболезненно.
Я кстати наоборот иногда замедляю видосы, потому что некоторые говорят слишком быстро. И как бы дело не в том, что непонятно, просто эмоционально напрягает быстрая речь.
Робоголос это как часть образа. Смысл мне тогда делать робота, который не звучит как робот?
Ну вот я слушая и опять тратя весь день только на то, чтобы сопоставить оригинальный и робоголос по таймингу, пришёл к мысли, что и оригинальный не разберут т.к. я так говорю по жизни.
Я сам часто смотрю на х2 скоростях. Но тут пользователь сам выбирает как ему смотреть.
Вот только роботы могут звучать по разному. Если это твой образ, это не отменяет того факта что тебе нужно добиться нормального звучания. Оптимус прайм тоже робот, но чтобы различать его речь, не нужно напрягаться.
Ну если будешь тренироваться, то речь станет лучше, но это потом. Для тебя что важнее: соблюсти образ, или чтобы твоим зрителям было комфортнее смотреть?
Ты можешь робовойс убавить в минимум, или добавить меж фраз глитчи какие-то. Или выделять эффектами какие-то определенные фразы, так будет лучше, чем ловить флешбеки с плохой связи в skype.
Над голосом еще неплохо бы поработать компрессором и эквалайзером. Вообще можешь скинуть мне в личку сэмпл голоса я могу покрутить плагины, а потом выдам тебе финальный результат и стэк плагинов с настройками.
Так и есть, и тебе нужно обеспечить эту возможность
Там и так всё это накинуто и все именно это и ругают.
ругают не за все это, а за невнятный результат
Ну уж как умею
У тебя дело не в скорости речи, а в ее невнятности. Если стараться быстро говорить, то все равно ничего путного не выйдет, в 2 раза ты свою речь не ускоришь, а невнятность, скорее всего, появится.
Вот ещё одна версия:
Проблема не в скорости. А во внятности. Тебе нужно учиться говорить более внятно и не съедать слова. Говорить быстро и внятно - очень сложно. Говорить медленно и внятно - проще. Это чисто на опыте приходит.
Если хочешь фидбека со стороны с минимумом усилий - запиши несколько вариантов вступительной речи и выложи сюда. А то каждый раз видос пересобирать - слишком много усилий. Пробуй добиться от своей речи внятности и разборчивости. Если сам не можешь понять, мы тут тебе поможем сторнним мнением.
P.S. Обработка голоса в самой первой версии была норм, если что. Вопрос чисто к внятности речи. Никто тебя не хейтит. Наоборот, хочется, чтобы ты добился хорошего результата.
Честно говоря, не совсем понимаю зачем сейчас тренировать дикцию. Есть же нейронки которые легко прочитают что угодно каким нужно голосом. В том числе и роботизированным.
Честно говоря, не совсем понимаю зачем сейчас что-либо делать самому. Есть же нейронки которые легко все что угодно за тебя сделают!
Ну, единственный вариант это если нравится сам процесс 🤔 Но чет мне кажется это не его случай.
Пруфы?
Мне такая нейронка нужна была два месяца назад, но я не нашёл ничего в свободном доступе, что начитывает "что угодно каким нужно голосом на русском языке".
Ну они точно есть, просто на русском я не видел пока, чтоб они идеально прям читали, ставили нормально акценты и не ошибались в произношении
Да зачем вы нейронки то ищите? Это сто лет уже как делается без нейросетей. Вот, тут вам и обычный голос, и под Левитана, и под кого угодно ещё.
Какова лицензия?
Не знаю, я Левитана не спрашивал.
TTS - убогая технология. Озвучивать чат на стриме - ОК. Но в продакшен - неа.
Частый косяк: неправильная интонация/ударение/произношение. Игнорирование пунктуации. Особенно в вопросительных или восклицательных предложениях, когда TTS видит знаки и произносит с нужной интонацией только последнее слова предложения. Выглядит крайне нелепо.
Если честно, я один нейросетевой движок таки нашёл. Я бы даже сказал что это нейро-api, позволяющее генерировать тексты на лету. Но качество генерации там всё равно оставляет желать лучшего.
Значит их пока нету. До тех пор пока здесь пруфы не появяется, что есть. И что именно на русском.
https://2ch-ai.gitgud.site/wiki/speech/sts/rvc/rvc/
Попробовал по их гайду на коллабе завести — ошибки какие-то. Но посмотреть можно.
Мне за тебя погуглить?
Как минимум есть silero, которой я пользовался для код20, он умеет в русский, там много голосов. За подписку можно нормально пользоваться. Были еще какие-то, но мне лень искать.
Меня вот только что в гугле разбанили. Нашёл, вроде неплохо:
https://gen-api.ru/model/tts-hd
Хорошо звучит да
Но это тоже сервисная история, для локального запуска пока не находил русскоязычных (но и не особо искал, если честно)
Случайно в предложке тытруба наткнулся, если кому интересно:
https://www.youtube.com/watch?v=8c2x0THsP9E
Тут может быть вопрос актёрской игры, за что наверно как раз актёры озвучки и будут упрекать нейроговорилки. Вот скажет нейроговоритель ровно так, как это "вижу" я? Не думаю. Пока не появится каких-то инструментов нормальных, чтобы __удобно__ расставлять всякие акценты паузы и прочее. Да хотя бы как img2img, только wav2wav.
Нейрокаверы уже 100 лет делают таким образом.
Ну больше я этого делать и не буду
Так норм или не норм? Я уже запутался от всех высказываний в разных местах. То робоголос не нравится, то ещё что-то.
Ну короче я понял относительно всего этого. Выводы сделал. Больше не буду ничего озвучивать.
Сам робоголос норм. Многим не нравится невнятность. Ты говоришь быстро, неразборчиво и съедаешь слова.
Идея с робо-аватаром, который говорит робовойсом - классная. Я пока нигде такого не видел. Тебе просто нужно поставить речь. Тренироваться, много записывать и получать фидбек.
Тебе даже не нужно было ничего переделывать. Оставил бы как есть, следующий ролик сделал бы лучше. Руслан Усачев, Бэд Комедиан - точно так же начинали. У них в ранних видосах-обзорах речь неразборчивая и быстрая. Но со временем они научились. Всё в твоих руках, если есть желание этим заниматься и совершенствоваться =)
Но это обычная стандартная речь. Я наоборот думал, что все уснут под такую монотонность и скорость.
Спасибо.
Если он будет. Вероятность 99%, что не случится.
Блёёёёё... И как мир живет с озвучками аниме и прочей фигни картаво-шепелявыми голосами? А ведь живет как-то! ¯\_(ツ)_/¯ И их смотрят, ругаются, но смотрят!
Старая версия меня не дождалась... Посмотрела на обычной скорости, мне нормас! Да, что-то невнятно слышно, но по смыслу вполне понятны слова. А надо ли больше? Особенно для видео, которое посмотрит не больше 10 человек... (это не в обиду автора, если кто не поймет, а наоборот!) Кароч, я не вижу проблемы! Тем более, это вроде не какой-то курс-обучение. Это типа посмотрел-по-приколу, полюбовался на аватарку, примерно понял, о чем разговор.
Просто чем плох вариант почитать статью, если не устроила видео-версия? Тем более, если хочется повникать во все тонкости.