Субота, 13 Квітня, 2024

Стівен Джон Янг: людина, яка навчила інформаційні системи розмовляти

Стівен Янг – це дослідник із Британії, підприємець, який обіймає посаду професора інженерії в Кембридзькому університеті. Людина видатного розуму, що є одним із перших розробників статистичних систем усного діалогу й автоматичного розпізнавання мови. Поговорімо про нього докладніше на liverpool-future.com

Ранні роки

Янг народився 23 січня 1951 року в Ліверпулі. З дитячих років Стівен відрізнявся допитливістю, любив читати, учитися, досліджувати й пізнавати щось нове.

Навчання давалося йому легко, а до точних наук у Янга були особливі здібності. Він легко вступив до одного з найкращих навчальних закладів Англії – Кембридзького університету, де блискуче закінчив курс.

У 1973 році Стівен Янг отримав ступінь бакалавра за спеціальністю електротехніка, а в 1978-му – докторський ступінь філософії в галузі розпізнавання мови. Також він читав лекції – як у Кембриджі, так і в Манчестері, а 1994 року очолив кафедру інформаційної інженерії у своєму рідному Кембридзькому університеті.

Кар’єра

Не всім користувачам сучасних технологій відоме ім’я Стівена Янга, але в професійному середовищі його знають усі – як провідного автора HTK toolkit – програмного інструментарію для обробки HMM (прихованої марківської моделі). Його використовують для моделювання часових рядів, що допомагають у розпізнаванні мови.

Початкова версія інструментарію була розроблена Стівеном Янгом у Лабораторії машинного інтелекту, розташованої на інженерному факультеті Кембридзького університету. У зв’язку з тим, що популярність HTK toolkit постійно зростала, причому не тільки в Англії, а й у всьому світі, Microsoft вирішила знову зробити інструментарій доступним, повернувши ліцензію CUED, у результаті чого програмне забезпечення стало доступним для всіх. Книга, яка є посібником з експлуатації інструментарію, отримала понад 7 тис. посилань.

Наприкінці 90-х років минулого століття наукові інтереси Стівена Янга дещо змінилися – він захопився розробкою статистичних систем усного діалогу. Найбільш значущий внесок дослідника в цю галузь – розробка POMDP (частково спостерігається марківський процес прийняття рішень), створений з урахуванням готового набору інструментів управління діалогом.

Його праці спрямовані на розробку таких систем усного діалогу, які не піддаються впливу перешкод, створюваних гучними пристроями розпізнавання людської мови. Крім того, подібні системи мали добре адаптуватися в режимі онлайн при комунікації з реальними людьми. Яскравим прикладом є застосування гаусівського процесу, який заснований на RL, тобто навчанні з підкріпленням для активного підвищення ефективності підходу.

В останні роки Стівен Янг із групою однодумців успішно застосовував методи навчання з підкріпленням до різноманітних підмодулів стандартних діалогових систем. Зрештою він отримав чимало нагород за найкращі доповіді про свій метод на багатьох міжнародних престижних конференціях.

Підприємницька діяльність

Кажуть, що талановита людина талановита у всьому. І в справедливості цього висловлювання ми можемо переконатися з прикладу Стівена Янга. Він виявив видатні здібності не лише у сфері інформаційної інженерії, а й у сфері підприємництва. Саме Янг зіграв ключову роль найбільш значних придбаннях наступних компаній:

  • VocallQ. Організація, що займається сучасними діалоговими технологіями. Вона розробила перший у світі користувальницький інтерфейс практичного програмування для діалогових систем. Технології VocallQ надали найновішу платформу для голосових інтерфейсів – вона дозволяє використовувати мобільні пристрої з голосовою підтримкою. Компанія була придбана Apple у 2015 році.
  • Entropic. Є розробником програмного забезпечення для розпізнавання людської мови. Також вона спроєктувала й вдосконалила програму для голосового зв’язку в інтернеті через мобільних операторів. Entropic була придбана компанією Microsoft у 1999 році.
  • Phonetic Arts. Займалася синтезом мови, розробляла та постачала технології, що допомагають створити природну, виразну людську мову. Справжній прорив свого часу! Наприклад, завдяки цим інноваціям герої комп’ютерних ігор змогли вимовляти фрази різними голосами та з живою, емоційною інтонацією. Компанія була придбана Google у 2010 році.

Нагороди, посади, звання

У 2004 році Стівен Янг отримав премію IEEE за значні досягнення в галузі технічної інформаційної інженерії, а у 2010 році відзначений медаллю ISCA за наукові праці. Крім того, дослідник є володарем нагороди Європейського товариства обробки сигналів та премії IEEE за обробку звуку та мовлення. 

2020 року Янг став членом Королівського товариства, а 2022 року, за заслуги у розробці програмних забезпечень, у День народження королеви був призначений командором ордена Британської імперії. 

У наші дні мовні взаємодії між інформаційними системами й користувачами не викликають подиву – це здається природним, простим та зручним. Однак не варто забувати, що ми отримали таку можливість завдяки Стівену Янгу – талановитій людині й видатному досліднику з Ліверпуля. Програми, розроблені Янгом, продовжують безперервно покращуватися, а це означає, що в найближчому майбутньому на нас чекають удосконалені технології та дивовижні інновації.

Latest Posts

.,.,.,.,. Copyright © Partial use of materials is allowed in the presence of a hyperlink to us.