Ну правда, достали уже с этим копипастом про якобы опубликованную работу о том, что настроения твиттера предсказывают изменение индекса Доу-Джонса. Мне интересно кто-нибудь из копипастеров оригинальный текст хотя бы смотрел? Для справки - электронная статься на arxiv.org не является полноценной научной публикацией. Обычно туда скидывают все, что ни попадя, в надежде на то, что когда-нибудь работу опубликует солидный журнал и приоритет будет спорным. Беглый просмотр показал. Настроения твиттера измеряются пятью различными численными характеристиками. Только две из них на статистике около 150 дней более-менее коррелируют с изменениями американского индекса. Далее сравниваются несколько предсказательных моделей, наиболее интересные из которых следующие: 1. D(i)=a+cD(i-1)+dD(i-2)+eD(i-3) 2. D(i)=a+cD(i-1)+dD(i-2)+eD(i-3)+fX(i-1)+gX(i-2)+hX(i-3) Где D(i) изменение индекса в день i, X(i) - один из измерителей настроений твиттера в день i. Первая модель (только по предыдущим значениям изменения индекса) дает правильный прогноз направления с вероятностью 73,3 % . Вторая (с использованием ценовых данных и данных твиттера) с вероятностью 86,7 %. Я думаю, что ребята сразу круто ошиблись, поскольку получить вероятность 73,3 для индекса с использованием только ценовых данных можно в двух случаях 1. Недостаточной статистики. 2. Использования средних цен, вместо цен закрытия. Авторы не указали какие именно цены они предсказывали. Подозреваю, что средние, что в принципе не интересно. Банальная модель взятия предыдущего направления средней цены даст вероятность 60-65 %. Для практики этот прогноз не имеет никакого смысла. Кроме того они ничего не написали про модель, в которой прогнозными факторами выступало бы только настроение твиттера. Опять же думаю, что они ее исследовали, но публиковать не стали, ибо результаты плачевны. Далее они дали своей статье скандальное и интригующее название. Журналисты прочитав скандальное название начали копипастить куда ни попадя. Копипастеры продолжили. Вот и вся история.