Суббота, 13 апреля, 2024

Стивен Джон Янг: человек, научивший информационные системы разговаривать

Стивен Янг – это исследователь из Британии, предприниматель, занимающий должность профессора инженерии в Кембриджском университете. Человек выдающегося ума, являющийся одним из первых разработчиков статистических систем устного диалога и автоматического распознавании речи. Давайте поговорим о нем подробнее на liverpool-future.com

Ранние годы

Янг родился 23 января 1951 года в Ливерпуле. С детских лет Стивен отличался любознательностью, обожал читать, учиться, исследовать и познавать что-то новое. 

Учеба давалась ему легко, а к точным наукам у Янга были особые способности. Он легко поступил в одно из лучших учебных заведений Англии – Кембриджский университет, где блестяще закончил курс.

В 1973 году Стивен Янг получил степень бакалавра по специальности электротехника, а в 1978-м – докторскую степень философии в области распознавания речи. Также он читал лекции – как в Кембридже, так и в Манчестере, а в 1994 году возглавил кафедру информационной инженерии в своем родном Кембриджском университете. 

Карьера

Далеко не всем пользователям современных технологий известно имя Стивена Янга, но в профессиональной среде его знают все – как ведущего автора HTK toolkit – программного инструментария для обработки HMM (скрытой марковской модели). Его используют для моделирования временных рядов, помогающих в распознавании речи.

Первоначальная версия инструментария была разработана Стивеном Янгом в Лаборатории машинного интеллекта, расположенной на инженерном факультете Кембриджского университета. В связи с тем, что популярность HTK toolkit постоянно росла, причем не только в Англии, но и во всем мире, Microsoft приняла решение снова сделать инструментарий доступным, вернув лицензию CUED, в результате чего данное программное обеспечение стало доступным всем. Книга, являющаяся пособием по эксплуатации инструментария, получила более 7 тыс. ссылок.

В конце девяностых годов прошлого века научные интересы Стивена Янга несколько изменились – он увлекся разработкой статистических систем устного диалога. Наиболее значимый вклад исследователя в эту область – разработка POMDP (частично наблюдаемый марковский процесс принятия решений), созданный на основе готового набора инструментов для управления диалогом. 

Его труды направлены на разработку таких систем устного диалога, которые не подвержены воздействию помех, создаваемых громкими устройствами распознавания человеческой речи. Кроме того, подобные системы должны были хорошо адаптироваться в режиме онлайн при коммуникации с реальными людьми. Яркий пример – применение гауссовского процесса, который основан на RL, то есть обучении с подкреплением для активного повышения эффективности подхода.

В последние годы Стивен Янг с группой единомышленников успешно применял методы обучения с подкреплением к разнообразным подмодулям стандартных диалоговых систем. В результате он получил немало наград за лучшие доклады о своем методе на многих международных престижных конференциях.

Предпринимательская деятельность

Говорят, что талантливый человек талантлив во всем. И в справедливости этого высказывания мы можем убедиться на примере Стивена Янга. Он проявил выдающиеся способности не только в области информационной инженерии, но и в сфере предпринимательства. Именно Янг сыграл ключевую роль в наиболее значимых приобретениях следующих компаний:

  • VocallQ. Организация, которая занимается современными диалоговыми технологиями. Она разработала первый в мире пользовательский интерфейс практического программирования для диалоговых систем. Технологии VocallQ предоставили новейшую платформу для голосовых интерфейсов – она позволяет использовать мобильные устройства с голосовой поддержкой. Компания была приобретена Apple в 2015 году.
  • Entropic. Является разработчиком программного обеспечения для распознавания человеческой речи. Также она спроектировала и усовершенствовала приложение для голосовой связи в интернете через мобильных операторов. Entropic была приобретена компанией Microsoft в 1999 году.
  • Phonetic Arts. Занималась синтезом речи, разрабатывала и поставляла технологии, помогающие создать естественную, выразительную человеческую речь. Настоящий прорыв для своего времени! Например, благодаря этим инновациям герои компьютерных игр смогли произносить фразы разными голосами и с живой, эмоциональной интонацией. Компания была приобретена Google в 2010 году.

Награды, должности, звания

В 2004 году Стивен Янг получил премию IEEE за значительные достижения в области технической информационной инженерии, а в 2010 году был удостоен медали ISCA за научные труды. Кроме того, исследователь является обладателем награды Европейского общества обработки сигналов и премии IEEE за обработку звука и речи.

В 2020 году Янг стал членом Королевского общества, а в 2022 году, за заслуги в разработке программных обеспечений, в День рождения королевы был назначен командором ордена Британской империи.

В наши дни речевые взаимодействия между информационными системами и пользователями не вызывают удивления – это кажется естественным, простым и удобным. Однако не стоит забывать, что мы получили такую возможность благодаря Стивену Янгу – талантливому человеку и выдающемуся исследователю из Ливерпуля. Программы, разработанные Янгом, продолжают непрерывно улучшаться, а это значит, что в ближайшем будущем нас ждут усовершенствованные технологии и удивительные инновации.

Latest Posts

.,.,.,.,. Copyright © Partial use of materials is allowed in the presence of a hyperlink to us.