Применяя результаты того проекта, исследователи в MIT сейчас научили совокупность машинного обучения искать диски обломков саму. Масштаб поиска требует автоматизации: имеется практически 750 миллионов вероятных источников света в данных, накопленных через Широко-полевого Инфракрасного Исследователя Обзора НАСА одна лишь (Умная) миссия.
В тестах совокупность машинного обучения согласовала с людскими идентификациями дисков обломков 97 процентов времени. Исследователи кроме этого научили собственную совокупность оценивать диски обломков в соответствии с их возможности содержания обнаружимых экзопланет. В газете, обрисовывающей новую работу в издании Astronomy и Computing, исследователи MIT информируют, что их совокупность идентифицировала 367 ранее неисследованных астрономических объектов как особенно многообещающих кандидатов на предстоящее изучение.Работа воображает необыкновенный подход к машинному обучению, которое было защищено одним из соавторов газеты, Виктора Панкратиуса, главного исследователя в Обсерватории Стога сена MIT.
В большинстве случаев, совокупность машинного обучения прочешет достаток данных тренировки, ища последовательные корреляции между изюминками данных и некоей этикетки, примененной людской аналитиком – в этом случае, звезды, окруженные дисками обломков.Но Панкратиус говорит, что в науках, совокупности машинного обучения были бы более нужными, если бы они очевидно соединились мало научного понимания, дабы оказать помощь вести их поиски корреляций либо выяснить отклонения от нормы, которая имела возможность воображать научный интерес.«Основное видение должно пойти вне того, на чем сосредотачивается A.I. сейчас», говорит Панкратиус. «Сейчас, мы собираем эти, и мы пробуем отыскать особенности в данных.
Вы заканчиваете с миллиардами и миллиардами изюминок. Так, что Вы делаете с ними? Что Вы желаете узнать, потому, что ученый не то, что компьютер говорит Вам, что определенные пиксели – определенные изюминки.
Вы желаете узнать, ‘О, это – физически соответствующая вещь, и тут есть параметрами физики вещи’».Концепция классаНовая бумага выросла из семинара MIT, что Панкратиус co-taught с Сарой Сиджер, Классом доктора наук 1941 года Почвы, Атмосферных, и Планетарных Наук, кто известен за ее изучение экзопланеты. Семинар, Астроинформатика для Экзопланет, представил студентов научным способам данных, каковые могли быть нужны для интерпретации наводнения данных, произведенных новыми астрономическими инструментами.
По окончании освоения с способами студентов попросили применить их к выдающимся астрономическим вопросам.Для ее последнего проекта В том месте Нгуен, аспирант в астронавтике и аэронавтике, выбрал проблему обучения совокупность машинного обучения, дабы выяснить диски обломков, и новая бумага – продукт той работы. Нгуен – первый создатель на бумаге, и к ней присоединяются Seager, Панкратиус, и Лора Экмен, студент, специализирующийся в информатике и электротехнике.
Из краудсорсингового проекта НАСА у исследователей были астрономические координаты источников света, каковые людские добровольцы идентифицировали как диски обломков показа. Диски распознаваемые как эллипсы света с мало более броскими эллипсами в их центрах.
Исследователи кроме этого применяли сырые астрономические эти, произведенные УМНОЙ миссией.Дабы подготовить эти к совокупности машинного обучения, Нгуен одурачил его в мелкие куски, после этого применял стандартные обрабатывающие сигнал способы, дабы отфильтровать экспонаты, вызванные инструментами отображения либо рассеянным светом. После этого, она отождествила те куски с источниками света в их центрах и применяла существующие методы сегментации изображения, дабы удалить каждые дополнительные источники света. Эти типы процедур обычны в любом проекте машинного обучения компьютерного видения.
Закодированные интуицииНо Нгуен применял ключевые принципы физики, дабы сократить эти потом. С одной стороны, она взглянуть на трансформацию в интенсивности света, излучаемого источниками света через четыре разных диапазона частот. Она кроме этого применяла стандартные метрики, дабы оценить положение, масштаб и симметрию источников света, устанавливая пороги для включения в ее комплект данных.
В дополнение к теговым дискам обломков из краудсорсингового проекта НАСА у исследователей кроме этого был маленький перечень звезд, каковые астрологи идентифицировали как, возможно, принимающие экзопланеты. От той информации их совокупность кроме этого вывела изюминке дисков обломков, каковые коррелировались с присутствием экзопланет, дабы выбрать эти 367 кандидатов на предстоящее изучение.