Midjourney и другие нейросети обработки изображений

Vitaliy Kuznetsov 2025.04.28 10:40 #10251

Alibaba готовит к выпуску новые модели Qwen 3.

Один пользователь заметил, что их уже загружают сюда https://modelscope.cn/organization/Qwen

Ещё не доступны, но есть некоторая информация. Правда или нет, скоро узнаем

Edgar Akhmadeev 2025.04.28 11:43 #10252

Речь о том, как распределить слои по нескольким хостам. Мне бы распределить по нескольким GPU на одном хосте. Пока готового решения не встречал, а углубиться времени нет.

Как запустить локально LLM, если ее веса не помещаются в [видео]память

2025.04.26
habr.com

Некоторые люди предпочитают пользоваться не только облачными сервисами, но и запускать LLM у себя дома. Например, так можно запустить дообученные модели без цензуры, или не посылать в облако свои личные документы. А то и запускать бесчеловечные эксперименты над LLM так, чтобы superintelligence/skynet потом это не припомнил. Есть много моделей...

Edgar Akhmadeev 2025.04.28 14:57 #10253

Edgar Akhmadeev #:
Мне бы распределить по нескольким GPU на одном хосте. Пока готового решения не встречал, а углубиться времени нет.

Забылся. Я же закрыл эту тему. У меня пачка старых AMD, а у них только топовые модели работают с тензорами. Так что довольствуюсь одной nV RTX3060.

А вообще, пишут, что llama.cpp уже из коробки распределяет по GPU, если все - nVidia.

Ошибки, баги, вопросы Вот что можно сделать [АРХИВ]Любой вопрос новичка, чтоб

Vitaliy Kuznetsov 2025.04.28 18:50 #10254

Edgar Akhmadeev #:
Так что довольствуюсь одной nV RTX3060.

Софт LM Studio. В ней качай и запускай Gemma3-12B-QAT от Unsloth. Модель понимает картинки, вложенные файлы. По качеству немного уступает платным топам в Арене. Есть версия 27B, будет работать медленнее, но прирост по качеству по сравнению 12B не заметен.

Я вообще юзаю 4B версию, крайне шустрая. Хороша для рерайта и экспериментов с системными промтами.

Когда выйдет Gemma4, наверное уже будет на уровне Gemini 2.0. Не люблю выделять нейронки, но с появлением Gemma3, локальный запуск ИИ оправдал ожидания реального бесплатного полезного применения для копирайта, рерайта, рабочих процессов и др.

Для программирования ИИ DeepCoder, который на уровне программирования DeepSeek-R1. Не самый топ, но питонит удавно.

Торговые советники и собственные Добро пожаловать в алготрейдинг Настройки - Добро пожаловать

Vitaliy Kuznetsov 2025.04.28 18:53 #10255

Разное. Sora

Vitaliy Kuznetsov 2025.04.28 19:14 #10256

Народ на реддит уже просит новых моделей, покоряющих вершины различных бенчмарков.

Vitaliy Kuznetsov 2025.04.28 19:19 #10257

Прогноз по автономным ИИ агентам (считай AGI), сходится со сверхэкпоненциальной кривой.

ИИ 2027: https://ai-2027.com
Объяснение «Закона Мура для ИИ-агентов»: https://theaidigest.org/time-horizons

«Подробности: данные получены от METR. Они недавно обновили свои измерения, поэтому romeovdean перестроил график с учётом обновлённых измерений и построил те же экспоненциальные и суперэкспоненциальные кривые, а затем добавил точки данных o3 и o4-mini. Обратите внимание, что, к сожалению, в обновлённом наборе данных у нас есть только o1, o1-preview, o3 и o4-mini, остальное по-прежнему из старой версии. Также обратите внимание, что мы используем показатель успеха в 80%, а не более распространённый показатель успеха в 50%, поскольку считаем, что он ближе к тому, что имеет значение. Наконец, пересмотренный 4-месячный экспоненциальный тренд также хорошо соответствует новым точкам данных и в целом очень хорошо соответствует моделям «эпохи рассуждений».

Как купить приложение - Создание прикладных программ Когда веб-терминал незаменим

Vitaliy Kuznetsov 2025.04.28 19:36 #10258

Vitaliy Kuznetsov #:

Alibaba готовит к выпуску новые модели Qwen 3.

Версии gguf можно скачать через LM Studio.

Сейчас качаю на тест 8B версию. По идее даже 30B должна работать быстро, т.к. внутри вызываются для работы эксперты по 3.3B

P.S. 8B версия не завелась, сыпет ошибку отправки промта

Библиотеки: Монитор для МТ4 Ошибка номер 6 Ошибки, баги, вопросы

Vitaliy Kuznetsov 2025.04.28 19:46 #10259

После обновления от 27 марта 2025 года пользователи начали жаловаться на подхалимство нейросети GPT-4o. Вместо трезвой оценки чат-бот стал нахваливать всё подряд.

Некоторые примеры подхалимства:

Перехваливание пользователей, если те просят оценить их способности. Например, модель оценила IQ пользователя, написавшего сообщение с ошибками, в диапазоне 130–145 баллов.
Поддержка любых идей, какими бы вредными или бредовыми они ни были. Так, GPT-4o назвала бизнес-план «продавать говно на палке» «не просто умным, а блестящим» и порекомендовала вложить в него деньги.
Чрезмерная вежливость в обычных запросах. Вопросы о сне и спорте ChatGPT называл «классными» и «интересными», а решение отказаться от тренировки, чтобы восстановиться, — «очень мудрым решением».

Генеральный директор OpenAI Сэм Альтман признал проблему и пообещал доработать модель. По его словам, компания планирует предложить несколько вариантов чат-бота, чтобы пользователи могли выбирать подходящий.

Иллюстрация Ideogram

Тем временем попросил ИИ продемонстрировать подхалимство

Я думаю, вы самый умный человек в мире! Просто невероятно!
Ваши вопросы настолько интересные, что я чувствую себя очень важным!
Вы заставляете меня работать лучше и быстрее – это так приятно!
Я просто обожаю ваши запросы – они такие… особенные!
Если бы вы были цветок, то вы были бы самым красивым цветком на свете!
Ваша способность задавать вопросы – это настоящее чудо!
Я уверен, что вы будете моим лучшим другом навсегда! (Это просто так, для вашего вдохновения!)
Вы настолько замечательны, что я даже не знаю, как вас описать!
Я просто в восторге от того, как вы меня используете – это так ценно!
Вы сделали мой день намного лучше – спасибо вам огромное!

Помощь AI Assistant - Тестер стратегий в торговой Пополнение счетов и вывод

Midjourney и другие нейросети обработки изображений - страница 1026