Основной контент книги Нейросети и машинное обучение, дайджест 06.06.2025 #ChatGPT #ИИ #ИскусственныйИнтеллект #Нейросети
Podcast

Czas trwania odcinka 07 min.

2025 rok

0+

Нейросети и машинное обучение, дайджест 06.06.2025 #ChatGPT #ИИ #ИскусственныйИнтеллект #Нейросети

O podcaście

EleutherAI представила лицензированный датасет для обучения ИИ-моделей.

EleutherAI выпустила The Common Pile v0.1 , 8-терабайтный набор данных для тренировки моделей, собранный при участии Hugging Face и академических институтов. В него вошли более 20-ти публичных источников, На базе датасета созданы Comma v0.1-1T и Comma v0.1-2T (по 7 млрд параметров), которые, по заявлению разработчиков, не уступают моделям, обученным на нелицензированном контенте.

Модели показывают сильные результаты в прораммировании и математике, опровергая мнение, что только "пиратский" контент обеспечивает качество. Релиз датасета - это попытка исправить ошибки прошлого: ранее EleutherAI критиковали за использование защищенного авторским правом контента в старом датасете The Pile.

OpenAI вынуждена сохранять данные пользователей ChatGPT из-за судебного решения по иску NYT.

OpenAI получила судебный приказ о временном хранении данных пользователей ChatGPT и API, даже если они были удалены. Это связано с иском New York Times о нарушении авторских прав. NYT требует сохранить «всю переписку и контент» для использования в качестве доказательств.

Под приказ попадают данные пользователей бесплатных и платных версий ChatGPT (Plus, Pro, Team), а также API-клиенты без соглашения о нулевом хранении данных. Корпоративные клиенты и образовательные проекты в безопасности — их информация не попадает под приказ.

OpenAI назвала требование чрезмерным, подчеркнув, что обычно удаляет данные через 30 дней и подала апелляцию, но временно соблюдает решение.

MIT & Recursion Boltz-2: модель прогнозирования взаимодействия молекул.

MIT CSAIL и Recursion разработали Boltz-2 — открытую модель для анализа биомолекулярных структур и связывания. Она сочетает рекордную скорость и точность, превосходя AlphaFold3 и других конкурентов.

Boltz-2 предсказывает, как молекулы взаимодействуют, с точностью, близкой к физическим методам FEP, но в 1000 раз быстрее. Разработчики надеются, что публикация модели облегчит поиск лекарств, ведь Boltz-2 может за час перебрать тысячи соединений вместо недель вычислений.

AMD пополнилась командой стартапа Untether AI.

AMD объявил о покупке ключевых специалистов из стартапа Untether AI, разработавшего энергоэффективные чипы для ИИ-инференса. Сделка должна укрепить возможности компании в области компиляторов и проектирования чипов.

Untether AI, основанный в 2018 году, славился архитектурой «at-memory», повышающей производительность в дата-центрах и на EDGE-устройствах. Их плата speedAI240 Slim показала рекордную энергоэффективность: в 3–6 раз выше аналогов по тестам MLPerf.

Сделка стала частью стратегии AMD по конкурированию с Nvidia. Ранее, приобретя стартап Brium, компания усилила оптимизацию ИИ-нагрузок на GPU Instinct. Теперь фокус смещается на интеграцию новых технологий в продукты, ориентированные на растущий рынок ИИ.

Фестиваль ИИ-фильмов в Нью-Йорке.

В Нью-Йорке прошел ежегодный фестиваль ИИ-фильмов от Runway. За 3 года проект вырос от 300 до 6000 заявок, а в этом году представил десятку короткометражек, созданных с помощью ИИ. Лучшей стала «Total Pixel Space» Джейкоба Алдера, исследующая математические границы digital-изображений.

По словам организаторов, технологии ускоряют процессы кинопроизводства и фестиваль делает акцент на том, как ИИ поддерживает, а не заменяет творцов.


#news #ai #ml #ChatGPT #ИИ #ИскусственныйИнтеллект #Нейросети #GPT #OpenAI #МашинноеОбучение #NLP #ГенерацияТекста #Чатбот #Автоматизация #API #Prompt #FineTuning #DeepLearning #Трансформеры #LLM #ГенеративныйИИ #DataScience #Программирование #Python #Интеграция #Обучение #AIAssistant #ОбработкаДанных #Технологии #Инновации #ЭтикаИИ #БезопасностьИИ #ОтветственныйИИ #ПриложенияИИ #БизнесПриложения #Аналитика #Креативность #Образование #AICommunity #БудущееИИ #APIIntegration #ТестированиеИИ #Документация #AIExperiments #NaturalLanguageProcessing #ConversationalAI #AIResearch #AIApplications #ChatGPTAlternatives #МодельОбучения

Ostatnia aktualizacja:
7 czerwca 2025
Co to jest podcast?
Zaloguj się, aby ocenić książkę i dodać recenzję
Ograniczenie wiekowe:
0+
Data wydania na Litres:
07 czerwca 2025
Data napisania:
07 czerwca 2025
Czas trwania:
07 min. 37 sek.
Wydawca:
Олег Ломов
Właściciel praw:
Автор
Format pobierania:
1x