development

Боты атакуют LinkedIn В продолжении цикла статей об создании Бот-системы для LinkedIn. Первая статья серии.

Предупреждение. Данная статья не является призывом к действиям, тем более противоправным. Не содержит тайн и секретов за семью замкам. Не стоит использовать ее для противоправных действий.

Введение

Итак, первым этапом в создании бота изначально является анализ и подбор подходящих и уже использовавшихся данных с их вариациями. Но это я опишу в одном из следующих материалов. В этом же мы рассмотрим как обходятся механизмы верификации человека в соц. сетях и других сервисах.

Капча

Капча существует достаточно давно, позволяет отсеять значительную часть простых ботов. Но, если цена достижения оправдана то и средства выбираются по финансам. Обходиться следующими методами...

Боты атакуют LinkedIn

То как все начиналось. Предыстория бот-системы

Несколько лет я работал в компании по поиску квалифицированного персонала для компаний заказчиков. И первым моим проектом было создание автоматизированной системы поиска персонала в социальной сети для профессионалов Linkedin. Все кто работал с заграницей знают о пользе LinkedIn. Там и компании, и специалисты. В течении около года я занимался созданием этой двухкомпонентной системы со связкой клиент-сервер. В компании уже существовало несколько автоматизированных шаблонов, созданных для ZennoPoster, но все данные хранились в нескольких файлах, в разных форматах и очень по глючному. Для работы хотя-бы 10 ботов параллельно нужно проработать всю архитектуру всей системы, а мы потенциально могли работать сразу в несколько десятков потоков и точно работали в 20-25 потоков уже на этапах тестов. Это 25 ботов в единицу времени. Чего достаточно для отправки нескольких сотен сообщений за пол часа-час. Некоторое время занимал "отстой" ботов прежде чем они начинали слать и быть в целом более активными.

Выгода

Я думаю бессмысленно говорить о том что хедхантеры получают оплату за найденного подходящего человека. Чем больше людей сможет найти компания и чем лучше отфильтрует, тем...
Семь баз данных за семь недель, Редмонд, Уилсон - отзыв по книге Взял книгу несколько месяцев назад, из 7ми баз данных Redis и MongoDB были мне уже знакомы, Postgree тоже, так как его использую постоянно в некоторых проектов. Читал я ее медленно, пока не понял как ее правильно читать нужно. Чтобы ее правильно и быстро читать, нужно сперва пройтись первый день для каждой базы и уже по впечатлениям углубляться в нужные. Некоторые базы я глянул обзорно и на первом дне закончил, так как общий принцип и некоторые частности того же Riak и HBase мне стали понятны, как тех же CouchDB и Neo4j. Случаи их применения достаточно специфичны в отличии от тех же Postgre, Redis, MongoDB по этому сильно углубляться есть смысл на конкретных проектах. В общем и целом книгой очень доволен, быстро и легко усваивается при правильном подходе. Есть вещи которые рассказываются с учетом продвинутого уровня, но в целом не дает объема и среднего уровня понимания. В каждой базе пропущены достаточно большие куски знаний, но эта книга и не создана для того чтобы их заполнить, она лишь открывает двери и показывает случаи применения. По некоторым книгам есть уже литература отдельная, документация и т.д. Для бекендеров считаю обязательным к прочтению если те занимаются только одной-двумя-тремя базами. Книга стоит своих денег.
cURL
Ну вот, добрался я таки до своего любимого C++. Разное использовал: PHP, JS, JQuery, C#, Asterisk и прочее с ними взятое. Все это в большей степени под Debian GNU\Linux. Но больше всего люблю именно C++. И вот стала задача, переписать воркеры(самостоятельные демоны для сайта), которые висят в фоне в определенном количестве, получают задачу от Gearman и выполняют ее. Вот один из них просто отправляет почту. Используем для этих целей smtp Yandex.ru. Все удобно и стабильно. До этого роль воркера выполняли PHP+Swiftmailer, но PHP не язык для подобных целей. Итак, хватит введения.
Можно подключаться через 25-й порт на smtp:://smtp.yandex.ru:25, но много провайдеров которые блокируют 25 порт и тем самым вы увидите сообщение:
Immediate connect fail for ####:###::##: Network is unreachable Trying ####:###::##...

По этому же поводу я общался со своим провайдером.

Комментариев особо не будет. Все достаточно просто. Сам код я взял отсюда, попутно поправив пару моментов.
Итак, сам код:

Load Balancing
В докладе рассказывается о том как построить архитектуру отказоустойчивого сервиса. Весьма полезно для тех кто планирует работать с высокими нагрузками. Достаточно полезно для тех кто хочет вспомнить некоторые основы тем кто уже работает с высоконагруженными сервисами. Построение кластерной основы для высоконагруженных сервисов.

Предисловие

Последних несколько месяцев использую Vim как IDE. Материалов по расширяемости в ру-язычном инете хватает. А вот с интеграцией его с системой контроля версий практически нету. Так как использую Git, про интеграцию Vim+Git и напишу маленькую заметку.

Для чего это?

Действительно, по началу задаешься вопросом "Для чего? Ведь все тоже легко сделать через консоль.". Можно, но на то он и vim чтобы используя его как можно меньше переключаться куда-то и делать что-то.

Для профессионалов конечно это не составляет проблем, но для новичков это может кое-что изменить:

#include "stdafx.h"
#include <iostream>

using namespace std;
//класс, который мы используем в качестве класса с данными
class t{
public:
    int data;
    int data2;
    int data3;
};
//класс, который мы используем в качестве указателя
class intp{
public:
    int pp;
};

int _tmain(int argc, _TCHAR* argv[])
{
    t dt;
    dt.data=3;
    dt.data2=5;
    dt.data3 = 10;

/*-->*/

Часть 1. Обзор GTK+

 

Пример многопоточности в C/C++ используя библиотеку pthread

 


Статья является моим условным переводом с английского статьи:
http://programming-in-linux.blogspot.com/2008/03/multithreading-example-...

По вопросам перевода: nelexis[(at)]gmail.com


 

Следующий листинг — простой пример демонстрирующий как вы можете создавать потоки использую POSIX pthread библиотеку.