ivanov_petrov | Идеальный голос

Застукал себя за тем, что трудно переносить "живой звук" - концертное пение, перемежаемое кашлем и хрюканьями, домашние записи и т.п. Только студийное качество - а это ведь звук отфотошопленный, правленый. Застукав, вспомнил слышанные жалобы - мол, с распространением моделей, красоток макияжных, отрисованных, декорированных - мужик во всемирном масштабе, мол, перестает высоко ценить естественные размеры, мысленно сравнивая наличное с многочисленными виденными образцами, где все на три размера больше, кожа глаже, со старательно удаленными родинками-складочками-морщинками. Себя на этом не ловил, но вот пример со звуком дал понять, о чем речь.

Тут же и речь вспомнилась, конечно - сначала речь диктора из громкоговорителя и радио, потом речь телевизионная, литературный язык - под этим названием бытует совсем разное слово, но ведь в самом деле распространяется иногда как "правильный, нормальный" вариант языка. То, чего вообще-то нет, нечто придуманное, занимает место естественного - впрочем, что там у человека естественное, а что сделанное, поди пойми.

Язык, сначала придуманный, возникает и распространяется, и если в семье говорили "литературно", то это родной язык. Косметика улучшается очень быстро, и то, что казалось недостижимым или требовало многочасового труда группы профессионалов, держалось считанные часы - теперь легко достигается любой, взявшейся за себя и купившей чудодейственный тюбик. Операциями достигаются фотошопные размеры и фактура кожи.

А голос? То, на что я обратил внимание - особые обертоны, особенно чистое и богатое оттенками звучание, которое достигается в студийной записи и не слышно иначе, что надо вшептать в микрофон, а потом вытянуть в готовой записи - вот это - может ли это быть тиражировано? Можно ли ожидать, что вокруг, обыденно, на улице - как сейчас идут с анимешными волосами, красными, синими и зелдеными, с на три размера превышающими всякое воображение глазами - вот также точно заговорят... Я не знаю, как это сделать - можно ожидать, что акустический человек станет таким же придуманным, идеальным, красивым, кавайным, искусственным, как он стал придуман в запахе, цвете и форме?

Полагаю, что прежде всего появятся звуковые фильтры для компьютерных разговоров - точнее для смартфонов. И человек, применяя звуковой эффект к своему голосу, будет его модулировать, обогащая басами, богатым звучанием, широтой регистра. Это есть, конечно, но пока это спецтехника - а будет, видимо, обычнейшим делом. Сначала как игра немногих, а со временем, видимо, говорить по телефону своим голосом будет столь же неуместно, как появиться на людях с естественным недельным запахом или неумытым - голос будет доставаться супругам и близким знакомым, прочие все будут слышать выбранный человеком тембр. Ну уже потом можно придумывать изменения и для естественного голоса - когда это станет повсеместной практикой в дистантном общении, возникнет спрос на изменения для близкого общения. Наверное. Собственно, рассуждение исключительно на аналогии - если запах, цвет, форму и пр. так активно меняют, то почему с голосом развитие должно проходить иначе.

Flat | Top-Level Comments Only

в подавляющем большинстве случаев никаких фильтров кроме компрессора, который не может существенно изменить картину, на диктора не кладут.
просто диктор долго учится говорить в студии, слушая себя и управлять голосом. интересно, что даже когда диктор как будто бы шепчет — он практически кричит, если судить по громкости звука. если не говорить в полный голос — хорошей записи не получится, как не фильтруй.
вживую диктор (когда он говорит "дикторским голосом") от записи не отличается.

что есть на самом деле, так это auto tune, для певцов без слуха и голоса, автоматически дотягивающий питч до ближайшей ноты. но это другая история.

Edited 2015-11-09 09:48 (UTC)

Понятно. Я не спорю. Просто это показывает, что то, что я быстренько проговариваю "они там придумают" - это большой набор задач, близкий по легкости к машинному переводу, о котором до сих пор масса людей полагают, что это нечто легкое и вполне техническое. Но мне кажется, что востребованность будет - значит, будут просто синтезировать то, что говорит пользователь, заново - а он выберет голос из библиотеки.

ну как бы это сказать... хороший голос делает осознанность говорения и внимание к себе, а не частотные характеристики.
будет самоосознающий синтезатор — будет и голос на заказ. не раньше.

Этак вы договоритесь до того, что рукописный тест значительнее и глубже, чем набранный на компьютере.
Я не о том, что хорошо и плохо, а о том, куда пойдут массы. Массы пойдут где им скажут, что легче - и хотя можно даже на компе писать почерком от руки, все равно клацать проще. Большинству. Ну и никаких самоосознающих вокалоидов не надо - будут выпевать глубоким трогательным баритоном "Ну что, сейчас по пивасику?"

он будет настолько же примерно трогательный, насколько трогателен голос автомобильного навигатора. аналогия с набранным текстом тут неверная, простите.
если бы мне не приходилось периодически болтать всякую рекламную чепуху под запись и работать с дикторами, я бы, возможно, думал иначе.

значит, нельзя создать симпатичный голос? Вот жаль какая. А туда же - прогресс-шмагресс.

Почему нельзя? Можно эту проблему вместе с проблемой машинного перевода решить разом — сократив количество допустимых высказываний и интонаций до минимально необходимого. "за пивасиком" в список точно попадёт.

А там и Искусственный Интеллект не за горами.

Идеальный голос

no subject

no subject

no subject

no subject

no subject

no subject

no subject