概要 👉 デモ 👉 背景 👉 実装 👉 評価 👉 APIの提供

📃 概要

 Text2Emojiは、文章を入力するとそれに合致したemojiを出力するシステムです。自然言語やemojiからなる独自のグラフ構造を構築し、入力単語からノードを辿ることで実現しています。

🪧 デモ

実行時間の制約上、入力は100文字以下に限定しています。

Result✨

ここに結果が表示されます

例えば、こんな言葉を入力してみて下さい🤔

  • お風呂、先入っちゃいなさい
  • この度はご卒業おめでとうございます
  • へっぽこプログラマの一日
  • 家に帰るまでが遠足です
  • 休みの日は、基本的に寝て過ごしています
  • 新型コロナウイルスにご注意ください

🔙 背景

 最近では、見出しにemojiを付与することでアイキャッチする手法がよく用いられています。

 🔗 [Zenn | エンジニアのための情報共有コミュニティ]

 🔗 [Notion | All-in-one workspace]

 emojiの絵柄はOSやフォントに依存するため、実装側のデザインコストが抑えられる点は長所です。一方で、ユーザは3000種類以上にも及ぶemojiから、最適なものを選ぶことを強いられます。

 そこで、自然言語とemojiからなるグラフ構造を構築し、入力文章に関連のあるemojiを推薦するシステムを構築しました。

💻 実装

 emojiに関連する単語のタグ付けを行ったemojilib[1]とその和訳[2]を、概念辞書であるWordNet[3][4]と結合させる手法を取りました。これにより、人力のタグ付けを最小限に抑えながら、多様な語彙への対応が可能になりました。

[1] muan/emojilib: Emoji keyword library. https://github.com/muan/emojilib
[2] yagays/emoji-ja: 📙UNICODE絵文字の日本語読み/キーワード/分類辞書📙 https://github.com/yagays/emoji-ja
[3] Fellbaum, Christiane. “WordNet.” Theory and applications of ontology: computer applications. Springer, Dordrecht, 2010. 231-243.
[4] Francis Bond, Timothy Baldwin, Richard Fothergill and Kiyotaka Uchimoto Japanese SemCor: A Sense-tagged Corpus of Japanese in The 6th International Conference of the Global WordNet Association, Matsue, 2012. 236-245.

 また、emoji同士の関係性構築のため、EmojiNet[5]を使用しました。emojiの多様な定義文をBERTによりベクトル化し、emojiの定量化・類似性算出を行いました。

[5] Wijeratne, Sanjaya, et al. “Emojinet: Building a machine readable sense inventory for emoji.” International conference on social informatics. Springer, Cham, 2016. 527-541.
[6] Devlin, J., Chang, M. W., Lee, K., & Toutanova, K. Bert: Pre-training of deep bidirectional transformers for language understanding. arXiv preprint arXiv:1810.04805. 2018.

評価

 2020年にリリースされたiOS14のemoji検索機能との比較は以下のとおりです。

  • 今日もご飯がおいしいな
    • iOS14: 🍚(ご飯で検索)
    • Text2Emoji: 🍚 🌾 🍛 🍙 😋
  • へっぽこプログラマ
    • iOS14: 該当なし(プログラマで検索)
    • Text2Emoji: 👩‍💻 👨‍💻 🧑‍💻

APIの提供

 Text2EmojiのRESTful APIの提供を行います。最低でも半年間の無償提供を予定しており、その後も計算資源の許す限り無償での提供に努めます。リクエストは、1ヶ月1万アクセス、1秒10アクセスが上限となります。利用を希望する方は以下のフォームからお申し込み下さい。

フォーム

また、上記デモのAPIキーは2週間程度公開した後、利用できなくなりますのでご注意下さい、