20181108
食べた
- 朝:チョコの棒
- 昼:セブンのチーズバーガーととり天
- 夜:シチューとしめじのバターライス
思った
卒論でword2vecを使い文書をベクトル化してほにゃららということをやっています。その過程でできたものがちょっと面白かったので書き残しておこうと思います。
word2vecについてはここでは深くは触れませんが、簡潔に言うと単語と単語の関連度をベクトルを用いて表すツールみたいなもので、これが可能になると単語と単語の足し算や引き算を機械にさせることができます。
例えば、王様-男+女=? という式がよく出てきます。この答えは女王様。人間ならなぞなぞ感覚で答えられそうですが、機械には意外と難しい。
こうした足し算や引き算を今回は「はてな匿名ダイアリー」通称増田の25000件ものエントリのテキストデータを元にしてやってみることにしました。
以下、結果です。横にある数値が高いほど答えとして妥当だと判定されています。
- 結婚-夢=?
('放棄', 0.44727423787117004) ('優遇', 0.4193519949913025) ('だるい', 0.41647660732269287) ('家事', 0.408141553401947) ('賛同', 0.39832884073257446) ('相続', 0.3881678879261017) ('抗議', 0.38618212938308716) ('賛成', 0.3815076947212219) ('体現', 0.37474632263183594) ('擁護', 0.37381818890571594)
そうか....結婚から夢を引くと”家事”がだるくて”放棄”しそれを”抗議”されて....
- 恋愛-セックス=?
('真っ当', 0.3856081962585449) ('対象', 0.3736887574195862) ('伴わ', 0.34657907485961914) ('野党', 0.34319087862968445) ('上野', 0.31923025846481323) ('SNS', 0.3185054361820221) ('範囲', 0.31736642122268677) ('未開', 0.3105405569076538) ('類', 0.3080369234085083) ('大雑把', 0.3069634437561035)
恋愛からセックスを引いたら”真っ当”らしいぞ!?つまり”セックスのある恋愛”は”真っ当”じゃないぞ!!?
そして地味に”SNS"が入っているのはかなり深い気がする。恋愛からセックス引いたら確かに今時SNSで連絡取ってる時間がかなりを占めてそう。
うーん、深い(深くない)
聞いた
- 鼻紙/KIRINJI
- まぶしがりや/KIRINJI
- かどわかされて/KIRINJI
風が吹くたび こぼれる
思いが いつも
夢のように叶うなら
オシャレも 彼も キッスも
たぶんそうさ 退屈さ