Улучшения и исправления в XRumer 23.0.5 StrongAI23 декабря 2024
Состоялось важное обновление XRumer 23.0.5 StrongAI, ключевое нововведение в котором — самообучение неизвестным полям и тексткапчам через GPT (при этом поддерживаются API аналогов GPT), а также повышение пробиваемости по форумам, контакт-формам и прочим платформам, расширение функционала.
ВАЖНО: Для получения действительно ощутимого прироста настоятельно рекомендуется:
- Если работаете по форумам, обязательно скачайте и поставьте новый пак нейросетей под XEvil 6.0 (ссылка также есть в кабинете), подробности в мануале ниже
- Используйте GPT для распознавания неизвестных тексткапч и полей, см. мануал ниже
- В режиме "Только регистрация" (при работе с форумами) обязательно делайте несколько проходов, с использованием Инструмента "Сгенерировать базу непробитых ресурсов"
- Наибольшую разницу с пред.версиями можно увидеть исключительно при работе с "сырыми" базами! В случае, если будете работать по проверенным базам от предыдущих версией, вы просто не будете охватывать вновь пробиваемые ресурсы
- Обязательно внимательно прочтите мануалы, представленные в конце поста! От этого напрямую зависит отдача от софта, Вы можете получить как X так и 10X прироста по трафику — всё зависит сугубо от соблюдения рекомендаций
Улучшения и исправления в XRumer 23.0.5 StrongAI
- обновлены прилагаемые базы, общий объём — более 18 миллионов сайтов!
- число ответов на тексткапчи увеличено на +30000, что существенно повысило пробиваемость трастовых форумов, блогов, CMS и контакт-форм
-
произведён ряд улучшений в работе с GPT / OpenAI:
- внедрена технология распознавания неизвестных полей и антибот-вопросов через GPT, результаты распознавания кэшируются и сохраняются локально, поэтому для обучения достаточно однократного прохода по базе с данной опцией, то есть с помощью GPT программа учится новому и по мере работы логика улучшается (результаты сохраняются в x23_gpt_fields.txt — их можно объединять, а по тексткапчам — в textcaptcha.txt)
- в интерфейс настроек GPT вынесена опция включения этого функционала и прокси для GPT
- скорректирован параметр "max_tokens" при работе тестовой формы, с GPT 3.5
- добавлена поддержка альтернативных LLM: api.mistral.ai*, api.proxyapi.ru**, aiguoguo199***
- для ChatGPT в список моделей на выбор добавлены: gpt-4o, gpt-4o-mini, gpt-4-turbo
- при соблюдении всех рекомендаций, описанных в начале поста, возможен прирост пробиваемости на 20-30% (в зависимости от платформ), в частности на тестах прирост отчёта "Активация" у нас составил +29%
- благодаря комплексному улучшению логики, приблизительно 5-10% тех ресурсов, что попадали в "Полууспешные", теперь успешно отправляются — и попадают в "Успешные" (наилучшая разница достигается при прохождении по "сырым", непроверенным базам)
- исправлено использование в прокси доменов вместо IP (с авторизацией), например теперь можно использовать прокси в формате: домен:порт:логин:пароль
- реализована возможность корректного закрытия XRumer извне с завершением сессии, при создании извне файла go_close.txt в папке XRumer - программа корректно завершится (при этом файл удалится)
- добавлена возможность задать не только хост, но и порт для отправки RC/HC/KC/CF в сервис
- значительно усовершенствована система решения арифметических тексткапч
- устранён баг дублирования при сохранении новых тексткапч в textcaptcha.txt
- реализована обработка core.front.system.register на форумах IPS (IP.Board)
- улучшена обработка тексткапч на форумах, гостевых, контакт-формах
- более, чем в 15 раз оптимизирована обработка meta-редиректов
- оптимизирована новая база тексткапч для повышения быстродействия
- реализована обработка параметра "data-inputmask"
- скорректирована обработка параметра "data-frmmask"
- расширено формирование отладочного лога FormFields.txt
- улучшена отправка в gform-контакт формы
- улучшена обработка <![CDATA[...]]>
- улучшена логика обработки форумов на движке *.free.fr
- устранена ошибка логики при регистрации на движке phpBB
- скорректировано получение параметра action для ReCaptcha v.3
- повышена пробиваемость гостевых webnode.*/guestbook/
- улучшена обработка AJAX-форм, в т.ч. на Joomla и WordPress
- программа обучена обрабатывать quiz-поля WordPress
- улучшена обработка нестандартных BMP-капч
- улучшен обход honeypot-полей
- улучшена обработка meta-тегов
* Пример xgpt.ini для api.mistral.ai:
[GPT_OpenAI] key=ключ model=open-mistral-7b temperature_min=6 temperature_max=9 tokens_min=350 tokens_max=4043 host=api.mistral.ai uri=/v1/chat/completions tc_solve=1 use_proxy=0 proxy= [GPT_OpenAI_Models] Model1=open-mistral-7b Model2=gpt-4 Model3=gpt-4-turbo-preview Model4=gpt-4o-mini Model5=gpt-4o
** Пример xgpt.ini для proxyapi.ru:
[GPT_OpenAI] key=ключ model=gpt-3.5-turbo temperature_min=6 temperature_max=9 tokens_min=5 tokens_max=700 host=api.proxyapi.ru uri=/openai/v1/chat/completions tc_solve=1 use_proxy=0 proxy= [GPT_OpenAI_Models] Model1=gpt-3.5-turbo Model2=gpt-4 Model3=gpt-4-turbo-preview Model4=gpt-4o-mini Model5=gpt-4o
*** Пример xgpt.ini для aiguoguo199:
[GPT_OpenAI] key=ключ host=api.aiguoguo199.com uri=/v1/chat/completions model=gpt-4o-mini temperature_min=6 temperature_max=700 tokens_min=350 tokens_max=700 tc_solve=1 use_proxy=0 proxy= [GPT_OpenAI_Models] Model1=gpt-3.5-turbo Model2=gpt-4 Model3=gpt-4-turbo-preview Model4=gpt-4o-mini Model5=gpt-4o
Использование GPT для решения тексткапч и неизвестных полей
Этот функционал может очень ощутимо повысить пробиваемость, особенно по форумам и контакт-формам. Результаты обучения кэшируются, т.е. нет необходимости использовать GPT снова и снова. Всё, что необходимо — это просто включить показанный на скриншоте чекбокс (меню "Настройки -> Настройки GPT генерации"), разумеется указав рабочий ключ GPT или его аналога:
При этом:
- Будут обрабатываться только неизвестные обязательные к заполнению поля, в случае если их не обработала стандартная логика XRumer (на самом деле, таких очень немного, но нередко именно они являются препятствием к отправке)
- Те поля и тексткапчи (логические антибот-вопросы "Посчитайте, сколько будет восемь на девять и добавьте в конце восклицательный знак") — решение которых в итоге привело к успешной отправке или регистрации, будут кэшироваться в файлы x23_gpt_fields.txt и textcaptcha.txt, таким образом в следующих проходах вам уже не потребуется включать GPT: "накопленные знания" будут использоваться, подгружаясь из этих файлов
- Результаты обучения через GPT от разных хрумеров можно объединять, ими можно обмениваться, можно продавать
- Важно также понимать, что это не панацея, и на многих сайтах также является препятствием к отправке ещё не известная AJAX-защита (хотя новая версия обучена обрабатывать многие виды AJAX-защит), а также ReCaptcha v3 (повышение score в решении этой капчи будет в XEvil 7.0, предзаказ стартует в ближайшие дни)
- Для работы из РФ и Беларуси можно задать зарубежный прокси, чтобы не было необходимости включать VPN, также теперь поддерживаются прокси с доменом вместо IP, рекомендуем для этого ReProxy
Новый набор нейросетей под XEvil 6.0 для форумных капч
Если работаете с форумами, и у вас есть XEvil 6.0 — настоятельно рекомендуем скачать и распаковать в подпапку XEvil 6.0 /Modules/x64/ новый набор нейросетей (ссылка на него — первая в кабинете, в разделе "Скачать"):
Важно учитывать:
- У многих из этих типов капч широко варьируются типоразмеры, поэтому их одновременное включение допускается только если софт умеет определять тип капчи и отсылает вместе с капчей — это умеет делать XRumer версии 23.0.5 StrongAI и выше
- В отличие от других капч, XRumer 23.0.5 шлёт в XEvil эти капчи через HTTP-интерфейс, поэтому желательно чтобы XEvil находился на этом же компьютере (с дефолтовым IP 127.0.01:80), а проверка API Key была выключена
-
Если же XEvil на другом IP, или же в нём задан другой порт, или включена проверка ключа API, то задайте их в параметрах xuser.ini:
XEVIL_FOR23_HOST=айпи_ксевила XEVIL_FOR23_PORT=порт_ксевила XEVIL_FOR23_KEY=ключ_ксевила[code]
Данные нейросети в разы лучше справляются с указанными типами капч, по сравнению с Default v.1 (но точность на многих не 100% — капчи сложные), это лишь означает, что на перечисленных платформах XRumer будет делать не 10-30 попыток , распознать, а 2-3 Нейросети уже включены в этом паке, то есть специально входить в Cores и включать чекбоксы необходимости нет; если же программа будет ругаться на возможные конфликты при большом числе включенных нейросетей — конкретно для этого набора (плюс Default v.1 и Individual v.1), и конкретно для XRumer 23.0.5 и выше, можно нажать на ОК (в будущем обновлении XEvil это будет учтено) — XRumer 23.0.5 вместе с этими капчами передает название нужной сети через параметр corename=название_сети Если всё сделано правильно, вы увидите во вкладке "Мониторинг" при работе по форумам имя отрабатывающей сети — x23_phpBB, x23_SMF и другие.