フォロワーとフォロー数をpythonで分析して気づいたこと

フォロワーとフォロー数をpythonで分析して気づいたこと



目次

  1. はじめに
  2. フォロー数とフォロワー数は比例する

  3. フォロー数は5000以上で制限がかかる

  4. 世の中には化け物は居る

  5. コード




   最近までのプログラミングの活動によってtwitter上の特定のアカウントの
フォロワーのアカウントや、ある特定のワードに関するアカウントを集めることに成功しました
さらに、フォロー数、フォワー数、ツイート数、いいね数
これらを自動的に入手し、操ることができています

今後の目標は機械学習を使って、特定のアカウントのフォロワーをタイプ別に振り分けることです
例えば、「フォロー数100、このフォロワー150、このツイート数500、このいいね数400であれば、あなたはこのアカウントのフォローを しているのではないですか?」
などなど、daigoみたいで面白そうです
ただその前に、これらの4つのデータを使ってちゃんと人が振り分けられるのか否かを考えなければなりません
(フォロー数、フォロワー数、ツイート数、いいね数だけで、あまねく全ての人をふるいわけられるのか?
そこでこれらの数値をグラフ化してみたところ、それまで気づけなかったことがだんだんと見えてきました
今回はそれらについての記事です

最後に、コードについても発表します!




はじめに

このフォロワー分析は、以下のツイートから始まり、多くの方の協力で成り立ちました。
ご協力ありがとうございました!




フォロー数とフォロワー数は比例する


これは皆さんなんとなく気づいていると思いますが...
フォロワー数とフォロー数は比例します


綺麗に並んでますね...
一直線の直線を描いています

これは心理学的な現象として説明できます
いわゆる「返報性の法則」というやつです
何かを受け取ったら返してもらわないと気が済まないというアレですね
twitter上でもフォローされたらお返しにフォローしないと気が済まないというやつでしょう




フォロー数は5000以上で制限がかかる

これは知らない人も多いと思います
気づくきっかけとなったのは、以下のグラフです


なぜか直線ができているのに気づくと思います
拡大してみましょう


この直線は明らかに不自然ですね!
フォロー数が5000以上のアカウントが綺麗に無くなっています
この謎を、ツイッターで聞いてみました
なるほど!
ツイッターでは5000以上フォローした場合、それ以上フォローするためにはそれなりのフォロワーが必要になる仕組みなんですね!
これに気づいただけでも、グラフを書いてみる価値はあると思います




世の中には化け物は居る

最後に、
どこの世界でも、他を寄せ付けないような飛び抜けた人はいるものです
それはグラフにして数値にすればより明確になります

グラフの右上にポツンと点がありますね
ここにいるのは @Jin115 という方で2009年から11年にわたってtwitterを続けてきた方です
恐ろしい...




コード

ソースコードは以下の通りです。
詳しいコードは
https://github.com/MineOwl/SeleniumTwitter ここで紹介しています


def plot_two_acount(acount1, acount2):
    X1,  labels = build_X(acount1)
    X2, labels = build_X(acount2)

    def plot_graph(x1, y1, x2, y2, x_label, y_label):
        plt.title("moon")
        plt.scatter(x1, y1, label=acount1)
        plt.scatter(x2, y2, label=acount2)

        plt.xlabel(x_label)
        plt.ylabel(y_label)
        plt.legend()
        plt.show()

    #plot_all_combination
    for i in range(0, len(labels)):
        for j in range(0,len(labels)):
            if(i>=j):
                continue
            x1 = np.array(X1).T[i] 
            y1 = np.array(X1).T[j]

            x2 = np.array(X2).T[i]
            y2 = np.array(X2).T[j]
            plot_graph(x1, y1, x2, y2, labels[i], labels[j])

            


tags

follow
python
follower

popular page

プログラミング言語の学ぶ順番について(初心者から中級者へ)後編

Pythonで入門書が終わった後(中級者)に勧めたい技術3選

urllibとbeautifulSoupでtwitterのツイート数,フォロー数,フォロワー数,いいね数,を取得する

another page

twitterのアカウントのフォロワーをseleniumで集めてみる

ツイッターの自動的なフォローをpythonとseleniumで!(RPA)

seleniumでtwitterに自動的にログインしてみた(RPA,スクレイピング)

CONTACT ME RIGHT NOW!

Lorem Ipsum is simply dummy text of the printing and typesetting industry. Lorem Ipsum has been the industry's standard dummy text ever since the 1500s.

5th Avenue, 987
38399, New York,
USA.

Tel. 9888-4394
Mail. hello@example.com
Skype. ExampleSkype

Your message has been sent. Thank you!

© Copyrights Studio. All Rights Reserved

Created with Studio template by TemplateMag
/* フッター/コピーライトのスタイル指定 */ footer { padding: 40px 16px; } footer .copyright small { color: #868686; font-size: 1.4rem; font-family: "Ubuntu Condensed", sans-serif; letter-spacing: .05em; }