banner

Новости

Mar 23, 2024

Мир

Способность ChatGPT создавать изящные эссе, электронные письма и код в ответ на несколько простых запросов привлекла международное внимание. Исследователи из Массачусетского технологического института сообщили о методе, который потенциально может проложить путь для программ машинного обучения, во много раз более эффективных, чем тот, который отвечает за ChatGPT. Более того, их технология может потреблять меньше энергии, чем современные суперкомпьютеры, используемые в современных моделях машинного обучения.

Команда сообщает о первой экспериментальной демонстрации новой системы, которая использует сотни лазеров микронного размера для выполнения вычислений, основанных на движении света, а не электронов. Новая система более чем в 100 раз более энергоэффективна, чем современные цифровые компьютеры для машинного обучения, и в 25 раз более мощна по плотности вычислений.

Более того, они отмечают «существенно еще несколько порядков для будущего улучшения». Это, добавляют ученые, «открывает путь к крупномасштабным оптоэлектронным процессорам для ускорения задач машинного обучения от центров обработки данных до децентрализованных периферийных устройств». В будущем небольшие устройства, такие как сотовые телефоны, смогут выполнять программы, которые можно вычислить только в крупных центрах обработки данных.

Модели массового машинного обучения, имитирующие обработку информации мозгом, лежат в основе глубоких нейронных сетей (DNN), подобных той, что лежит в основе ChatGPT. В то время как машинное обучение расширяется, цифровые технологии, лежащие в основе сегодняшних DNN, перестают работать. Кроме того, их часто можно встретить только в очень больших центрах обработки данных из-за их экстремальных потребностей в энергии. Это стимулирует инновации в вычислительной архитектуре.

Дисциплина науки о данных развивается благодаря появлению глубоких нейронных сетей (DNN). В ответ на экспоненциальное расширение этих DNN, которое обременяет возможности традиционного компьютерного оборудования, оптические нейронные сети (ONN) недавно были разработаны для выполнения задач DNN на высоких тактовых частотах, параллельно и с минимальной потерей данных. Низкая эффективность электрооптического преобразования, огромные размеры устройств и перекрестные помехи в каналах способствуют низкой плотности вычислений в ONN, а отсутствие линейной нелинейности приводит к значительной задержке. Исследователи экспериментально продемонстрировали, что система ONN с пространственно-временным мультиплексированием способна решить все эти проблемы одновременно. Они используют кодирование нейронов с помощью массивов микрометровых лазеров поверхностного излучения с вертикальным резонатором (VCSEL), которые производятся в больших количествах и демонстрируют превосходное электрооптическое преобразование.

Впервые исследователи представили небольшую конструкцию, которая решает эти три проблемы одновременно. Современное дистанционное зондирование LiDAR и лазерная печать используют эту архитектуру, построенную на матрицах вертикальных лазеров поверхностного излучения (VCSEL). Эти меры кажутся улучшением на два порядка в ближайшем будущем. Оптоэлектронный процессор предоставляет новые возможности для ускорения процессов машинного обучения в централизованных и распределенных инфраструктурах.

ПроверьтеБумагаиБлог . Вся заслуга в этом исследовании принадлежит исследователям этого проекта. Также не забудьте присоединитьсянаш 27 тысяч+ ML SubReddit,Дискорд-канал, иИнформационный бюллетень по электронной почте, где мы делимся последними новостями исследований в области искусственного интеллекта, интересными проектами в области искусственного интеллекта и многим другим.

Дханшри Шенвай — инженер по компьютерным наукам, имеет хороший опыт работы в финтех-компаниях, занимающихся финансами, картами и платежами и банковским делом, а также большой интерес к приложениям искусственного интеллекта. Она с энтузиазмом относится к изучению новых технологий и достижений в современном развивающемся мире, которые делают жизнь каждого проще.

БумагаБлогнаш 27 тысяч+ ML SubRedditДискорд-каналИнформационный бюллетень по электронной почте
ДЕЛИТЬСЯ