Эндрю Герет Барто

Эндрю Герет Барто

англ. Andrew Gehret Barto

учёный

Э́ндрю Ге́рет Ба́рто (^{[Нет даты!]}) — американский специалист в области информатики наиболее известный своими работами в области современных вычислительных методов обучения с подкреплением^[1]. В 2025 году вместе со своим бывшим аспирантом Ричардом Саттоном был удостоен премии Тьюринга от Ассоциации вычислительной техники.

Биография[править]

Образование[править]

Изучал математику в Мичиганском университете, который окончил с отличием в 1970 году. Первоначально специализировался на корабельной инженерии, однако после изучения ряда работ Майкла Арбиба, Маккалока и Питтса заинтересовался методами моделирования работы мозга при помощиискусственных нейронных сетей; пять лет спустя получил учёную степень в области информатики за диссертацию о клеточных автоматах^[2].

Начало карьеры[править]

Постдокторантуру проходил в Колледже информатики и компьютерных наук Массачусетского университета в Амхерсте, куда поступил в 1977 году; в 1982 году стал доцентом, а в 1991 — профессором. С 2007 по 2011 год — заведующий кафедрой и основной преподаватель Программы по нейронаукам и поведению^[3]. В этот же период возглавлял (как соруководитель) Лабораторию автономного обучения, где были обоснованы несколько ключевых подходов и разработаны важнейшие технологии в области обучения с подкреплением. За свою карьеру Эндри Барто выпустил 27 аспирантов, 13 из которых стали получили учёное звание профессора. В числе его учеников другой известный специалист в области машинного обучения с подкреплением Ричард Саттон.

Обучение с подкреплением[править]

Барто и Саттон входили в группу исследователей, изучавших работу нейронов в мозге как основу для создания систем, имитирующих мыслительный процесс человека. Им удалось существенно развить идеи Гарри Клопфа — другого видного теоретика в области искусственного интеллекта — и предложить свою математическую концепцию («обучение с подкреплением»), которая стал ключевым элементом для создания современных систем искусственного интеллекта^[4].

Барто и Саттон модернизировали марковский процесс принятия решений для объяснения того, как агенты (алгоритмические сущности) принимают решения в стохастической среде таким образом, что и среда и награды могли бы оставаться неизвестными — такой метод позволил применить этот алгоритм к широкому кругу задач^[5]. Предложенный учёными подход совершенствовался и развивался — а первым крупным его применением стало создание программы AlphaGo, которая сумела обучиться игре в го и в 2016 году превзойти одного из сильнейших игроков мира^[4].

Труды Барто и Саттона широко известны во всем мире, а сами учёные признаны основоположниками современного метода обучения с подкреплением, сделавшим возможным создание современных больших языковых моделей^[6].

Барто опубликовал более ста научных работ. Вместе с Ричардом Саттоном он является соавтором книги «Обучение с подкреплением: Введение», а также входит в редакторский коллектив книги «Справочник по обучению и приближённому динамическому программированию»^[7].

Награды[править]

Барто является членом Американской ассоциации содействия развитию науки, старшим членом IEEE^[8], а также членом Американской ассоциации искусственного интеллекта и Общества нейронаук^[9].

Барто был удостоен награды Университета Массачусетса за достижения в области нейронаук 2019 году, премии IEEE Neural Network Society Pioneer Award в 2004 году^[10] и IJCAI Award for Research Excellence в 2017 году. В его наградной цитате говорилось: «Профессор Барто признан за его новаторские и значимые исследования как в теории, так и в применении обучения с подкреплением»^[11].

В 2025 году Барто и Саттон отмечены премией Тьюринга «за разработку концептуальных и алгоритмических основ обучения с подкреплением»^[12]^[13]^[14].

Примечания[править]

↑ UJCAI 2017 Awards англ. (10.03.2025).
↑ Virtual History Interviews англ. (10.03.2025).
↑ Эндрю Дж. Барто. Массачусетский университет в Амхерсте (17 февраля 2008). Архивировано из первоисточника 28 ноября 2020. Проверено 18 октября 2020.
↑ ^4,0 ^4,1 Мец, Кейд. Премия Тьюринга присуждена двум пионерам искусственного интеллекта (en-US), The New York Times (5 марта 2025).
↑ Премия А.М. Тьюринга. amturing.acm.org. Проверено 8 марта 2025.
↑ Пионеры ИИ Эндрю Барто и Ричард Саттон получают премию Тьюринга 2025 года за новаторский вклад в обучение с подкреплением | NSF – Национальный научный фонд англ.. www.nsf.gov (5 марта 2025). Проверено 8 марта 2025.
↑ UMass Amherst: Кафедра информатики Архивировано из первоисточника 2 сентября 2006.
↑ Барто избран членом IEEE. Массачусетский университет в Амхерсте (22 ноября 2005). Архивировано из первоисточника 3 декабря 2019. Проверено 3 декабря 2019.
↑ CMU CS – Семинар по ИИ. www.cs.cmu.edu. Проверено 7 марта 2025.
↑ "IEEE Computational Intelligence Society Past Recipients" (6 сентября 2022). Проверено 6 сентября 2022.
↑ Награды IJCAI 2017 (19 августа 2017). Проверено 6 сентября 2022.
↑ Лауреаты премии Тьюринга – Дирекция по компьютерным и информационным наукам и инженерии (CISE) | NSF – Национальный научный фонд англ.. www.nsf.gov (5 марта 2025). Проверено 8 марта 2025.
↑ Мец, Кейд. Премия Тьюринга присуждена двум пионерам искусственного интеллекта (en-US), The New York Times (5 марта 2025).
↑ Мец, Кейд. Премия Тьюринга присуждена двум пионерам искусственного интеллекта (en-US), The New York Times (5 марта 2025).

Машинное обучение и data mining ↑ [+]
Задачи	Задача классификации Обучение без учителя Обучение с частичным привлечением учителя Регрессионный анализ AutoML Ассоциативные правила Выделение признаков Обучение признакам Обучение ранжированию Грамматический вывод Онлайновое обучение Перенос обучения Многоклассовая классификация
Обучение с учителем	Метод k-ближайших соседей Наивный байесовский классификатор Дерево решений Метод опорных векторов Линейная регрессия Логистическая регрессия Перцептрон Ансамбли моделей Бэггинг Бустинг Random forest Метод релевантных векторов
Кластерный анализ	Метод k-средних Метод нечёткой кластеризации Иерархическая кластеризация EM-алгоритм BIRCH CURE DBSCAN OPTICS Mean-shift
Снижение размерности	Факторный анализ Метод главных компонент CCA ICA LDA Неотрицательное матричное разложение t-SNE
Структурное прогнозирование	Графовая вероятностная модель Байесовская сеть Скрытая марковская модель CRF
Выявление аномалий	Метод k-ближайших соседей Локальный уровень выброса
Графовые вероятностные модели	Байесовская сеть Марковская сеть Скрытая марковская модель
Нейронные сети	Ограниченная машина Больцмана Самоорганизующаяся карта Функция активации Сигмоида Softmax Радиально-базисная функция Метод обратного распространения ошибки Глубокое обучение Многослойный перцептрон Рекуррентная нейронная сеть Долгая краткосрочная память Управляемый рекуррентный блок Свёрточная нейронная сеть U-Net Автокодировщик
Обучение с подкреплением	Марковский процесс Уравнение Беллмана Жадный алгоритм Q-обучение SARSA Temporal difference (TD)
Теория	Теория Вапника — Червоненкиса Дилемма смещения–дисперсии Теория вычислительного обучения Минимизация эмпирического риска Оккамово обучение PAC learning Статистическая теория обучения
Журналы и конференции	NeurIPS ICML ML JMLR ArXiv:cs.LG

Одним из источников, использованных при создании данной статьи, является статья из википроекта «Рувики» («ruwiki.ru») под названием «Эндрю Герет Барто», расположенная по адресу:

—	«https://ru.ruwiki.ru/wiki/Эндрю_Герет_Барто»

Материал указанной статьи полностью или частично использован в Циклопедии по лицензии CC-BY-SA 4.0 и более поздних версий.

Всем участникам Рувики предлагается прочитать материал «Почему Циклопедия?».

[:1-1] UJCAI 2017 Awards англ. (10.03.2025).

[:2-2] Virtual History Interviews англ. (10.03.2025).

[University_of_Massachusetts_Amherst-2008-3] Эндрю Дж. Барто. Массачусетский университет в Амхерсте (17 февраля 2008). Архивировано из первоисточника 28 ноября 2020. Проверено 18 октября 2020.

[Metz-2025-4] 4,0 ^4,1 Мец, Кейд. Премия Тьюринга присуждена двум пионерам искусственного интеллекта (en-US), The New York Times (5 марта 2025).

[5] Премия А.М. Тьюринга. amturing.acm.org. Проверено 8 марта 2025.

[6] Пионеры ИИ Эндрю Барто и Ричард Саттон получают премию Тьюринга 2025 года за новаторский вклад в обучение с подкреплением | NSF – Национальный научный фонд англ.. www.nsf.gov (5 марта 2025). Проверено 8 марта 2025.

[7] UMass Amherst: Кафедра информатики Архивировано из первоисточника 2 сентября 2006.

[8] Барто избран членом IEEE. Массачусетский университет в Амхерсте (22 ноября 2005). Архивировано из первоисточника 3 декабря 2019. Проверено 3 декабря 2019.

[9] CMU CS – Семинар по ИИ. www.cs.cmu.edu. Проверено 7 марта 2025.

[10] "IEEE Computational Intelligence Society Past Recipients" (6 сентября 2022). Проверено 6 сентября 2022.

[mw-2017-11] Награды IJCAI 2017 (19 августа 2017). Проверено 6 сентября 2022.

[12] Лауреаты премии Тьюринга – Дирекция по компьютерным и информационным наукам и инженерии (CISE) | NSF – Национальный научный фонд англ.. www.nsf.gov (5 марта 2025). Проверено 8 марта 2025.

[13] Мец, Кейд. Премия Тьюринга присуждена двум пионерам искусственного интеллекта (en-US), The New York Times (5 марта 2025).

[14] Мец, Кейд. Премия Тьюринга присуждена двум пионерам искусственного интеллекта (en-US), The New York Times (5 марта 2025).

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

Эндрю Герет Барто

Содержание

Биография[править]

Образование[править]

Начало карьеры[править]

Обучение с подкреплением[править]

Награды[править]

Примечания[править]

Навигация

Эндрю Герет Барто

Биография[править]

Образование[править]

Начало карьеры[править]

Обучение с подкреплением[править]

Награды[править]

Примечания[править]

Навигация

Поиск