Но развитие процессов для производства тех материалов продолжило зависеть от комбинации опыта, интуиции и ручных литературных обзоров.Команда исследователей в MIT, Массачусетский университет в Амхерсте и Калифорнийский университет в Беркли сохраняют надежду преодолеть тот разрыв автоматизации материаловедения с новой совокупностью ИИ, которая думала бы через научно-исследовательские работы, дабы вывести «рецепты» для производства конкретных материалов.«Вычислительные материаловеды сделали много удач, ‘что’ сделать – какой материал проектировать на базе желаемых особенностей», говорит Эльза Оливетти, Атлантический доцент Ричфилда энергетических Изучений в Отделе MIT Разработки и Материаловедения (DMSE). «Но из-за того успеха, узкое место перешло к, ‘Прекрасно, сейчас как я делаю его?’»Исследователи предполагают базу данных, которая содержит рецепты материалов, извлеченные из миллионов бумаг.
инженеры и Учёные имели возможность ввести имя целевого материала и любых вторых параметров – предшествующих материалов, условий реакции, процессов фальсификации – и потянуть предложенные рецепты.Как ход к пониманию, что видение, Оливетти и ее сотрудники создали совокупность машинного обучения, которая может проанализировать научно-исследовательскую работу, выведите, какой из ее параграфов содержит рецепты материалов и классифицирует слова в тех параграфах в соответствии с их ролям в рамках рецептов: заглавия целевых материалов, числовых количеств, названий элементов оборудования, условий работы, описательных прилагательных, и т.п..В газете, появляющейся в последнем выпуске издания Chemistry of Materials, они кроме этого демонстрируют, что совокупность машинного обучения может проанализировать извлеченные эти, дабы вывести неспециализированные характеристики классов материалов – такие как разные диапазоны температур, которых их синтез требует – либо конкретные изюминки отдельных материалов – такие как разные физические формы, каковые они примут, в то время, когда их условия фальсификации изменятся.Оливетти – ведущий создатель на бумаге, и к ней присоединяется Эдуард Ким, аспирант MIT в DMSE; Кевин Хуан, DMSE postdoc; Адам Сондерс и Эндрю Маккаллум, программисты в Массачусетском университете Амхерст; и Джербрэнд Седер, доктор наук канцлера в Отделе Разработки и Материаловедения в Беркли.
Заполнение промежутковИсследователи научили собственную совокупность, применяя комбинацию контролируемых и безнадзорных способов машинного обучения. «Контролируемый» свидетельствует, что эти тренировки, питаемые совокупность, сперва аннотируются людьми; совокупность пробует отыскать корреляции между исходными данными и аннотациями. «Безнадзорный» свидетельствует, что эти тренировки не аннотируются, и совокупность вместо этого обучается собирать эти совместно в соответствии с структурным неспециализированным чертам.Потому, что извлечение рецепта материалов – новая область изучения, у Оливетти и ее сотрудников не было роскоши громадных, аннотируемых комплектов данных накопленной за годы разнообразными командами исследователей. Вместо этого они должны были аннотировать собственные эти сами – в конечном итоге, примерно 100 бумаг.
По стандартам машинного обучения это – достаточно мелкий комплект данных. Дабы улучшить его, они применяли метод, созданный в Гугл по имени Word2vec. Word2vec наблюдает на контексты, в которых слова происходят – синтаксические роли слов в других словах и предложениях около них – и группируется слова, каковые имеют тенденцию иметь подобные контексты. Так, к примеру, в случае если одна бумага содержала предложение, «Мы нагрели титан tetracholoride до 500 C», и второй содержал предложение «Гидроокись натрия, был нагрет до 500 C», Word2vec сгруппирует «титан tetracholoride» и «гидроокись натрия» совместно.
С Word2vec исследователи смогли существенно увеличить собственный учебный комплект, поскольку совокупность машинного обучения имела возможность вывести, что этикетка, приложенная к любому данному обещание, возможно, будет относиться к вторым словам, сгруппированным с ним. Вместо 100 бумаг исследователи имели возможность так научить собственную совокупность примерно на 640 000 бумаг.Вершина айсберга
Дабы проверить точность совокупности, но, они должны были надеяться на маркированные эти, поскольку у них не было критерия оценки его работы на немаркированных данных. В тех тестах совокупность смогла отождествить с 99-процентной точностью параграфы, каковые содержали рецепты и маркировать 86-процентной точностью слова в рамках тех параграфов.
Исследователи сохраняют надежду, что предстоящая работа улучшит точность совокупности, и в длящейся работе они исследуют батарею глубоких способов изучения, каковые смогут сделать предстоящие обобщения о структуре рецептов материалов, с целью автоматической разработки рецептов для материалов не рассмотренными в существующей литературе.Большинство предшествующего изучения Оливетти сконцентрировалась на нахождении более рентабельных и экологически важных способов произвести нужные материалы, и она сохраняет надежду, что база данных рецептов материалов имела возможность подстрекать тот проект.