Умпутун
👤 SpeakerAppearances Over Time
Podcast Appearances
Он до последнего времени с этим очень плохо справлялся. То есть иногда справлялся, иногда коллекционировал вплоть до того, что дописывал статью, которая там не была. Вот это 4О и 4О мини оба совершенно замечательно с этим справляются.
Он до последнего времени с этим очень плохо справлялся. То есть иногда справлялся, иногда коллекционировал вплоть до того, что дописывал статью, которая там не была. Вот это 4О и 4О мини оба совершенно замечательно с этим справляются.
Я немного экспериментов проводил, но все мои промты, которые я им давал, во-первых, текст не портили, во-вторых, очищали его правильно, и мало того, они маркдаун делали Я даже ему не говорил сделать красивый маркдаун по главам, по параграфам. Он все это сам красиво сделал.
Я немного экспериментов проводил, но все мои промты, которые я им давал, во-первых, текст не портили, во-вторых, очищали его правильно, и мало того, они маркдаун делали Я даже ему не говорил сделать красивый маркдаун по главам, по параграфам. Он все это сам красиво сделал.
Это дело двигается в сторону, когда обработка данных вот такая, прямо скажем, нетривиальная, уже при помощи черных ящиков становится возможной. Вот так вот. Вот примерно так. А о чем мы говорим-то? Какая у нас тема выбрана? Про OpenAI. Про Reasoning Mode. Но то, что она медленно работает, она реально медленно работает. Вы видели?
Это дело двигается в сторону, когда обработка данных вот такая, прямо скажем, нетривиальная, уже при помощи черных ящиков становится возможной. Вот так вот. Вот примерно так. А о чем мы говорим-то? Какая у нас тема выбрана? Про OpenAI. Про Reasoning Mode. Но то, что она медленно работает, она реально медленно работает. Вы видели?
Я, кстати, в задачу контекста уперся. Я уже почти решил выбросить наш ньюс и написать вот на GPT, а уперся в контекст. Вы знаете, есть такие сайты, у которых размер вот этого бади настолько чудовищно большой, что ни в какие контексты он не влазит. Любая статья на Хабре практически вот так выглядит. То есть статья без комментариев.
Я, кстати, в задачу контекста уперся. Я уже почти решил выбросить наш ньюс и написать вот на GPT, а уперся в контекст. Вы знаете, есть такие сайты, у которых размер вот этого бади настолько чудовищно большой, что ни в какие контексты он не влазит. Любая статья на Хабре практически вот так выглядит. То есть статья без комментариев.
Просто возьмите руками статью и докрутите до конца, где начинаются комментарии, она уже не влазит в контекст. Ну, там... Развернулись по буфету. Поэтому тут есть задача при процессинге. Как-то надо уметь сжимать все это дело.
Просто возьмите руками статью и докрутите до конца, где начинаются комментарии, она уже не влазит в контекст. Ну, там... Развернулись по буфету. Поэтому тут есть задача при процессинге. Как-то надо уметь сжимать все это дело.
Да, извлечь из него текст. Извлеки текст, осмысленный этой статьей, убери все остальное, текст не меняй, добавь summary, напиши автор, напиши title. Если есть картинка, оставь ее в середине, сделай, чтобы Markdown эту картинку показывал на исходную. Вот это все он делает с маленькими сайтами превосходно, с нормального размера статьями превосходно.
Да, извлечь из него текст. Извлеки текст, осмысленный этой статьей, убери все остальное, текст не меняй, добавь summary, напиши автор, напиши title. Если есть картинка, оставь ее в середине, сделай, чтобы Markdown эту картинку показывал на исходную. Вот это все он делает с маленькими сайтами превосходно, с нормального размера статьями превосходно.
А вот как на хабра попадаем... Слушай, мы с хабра особо ничего не добавляли. Да неважно. Хабр, не хабр, но кто-то нам такой на мегабайт попадется, где страничка в мегабайт весь. Сейчас так в вебе принято.
А вот как на хабра попадаем... Слушай, мы с хабра особо ничего не добавляли. Да неважно. Хабр, не хабр, но кто-то нам такой на мегабайт попадется, где страничка в мегабайт весь. Сейчас так в вебе принято.
Ну, ты знаешь, Леха, какую альтернативу предлагают в этой задаче при помощи GPT, как решать, да? Слышал, умники, что говорят? Умники говорят, ты дебил, говорят умники, тому, кто засовывает статьи туда. Ты не засовывай статью туда. То есть ты статью засунь туда, но попроси вместо этого сгенерировать код, который регексами всю эту статью разберет. А потом этот код использует для всех других сайтов.
Ну, ты знаешь, Леха, какую альтернативу предлагают в этой задаче при помощи GPT, как решать, да? Слышал, умники, что говорят? Умники говорят, ты дебил, говорят умники, тому, кто засовывает статьи туда. Ты не засовывай статью туда. То есть ты статью засунь туда, но попроси вместо этого сгенерировать код, который регексами всю эту статью разберет. А потом этот код использует для всех других сайтов.