Slow Informatics Laboratory Get in Touch

Get In Touch

当研究室への配属を希望される方,研究プロジェクトにご関心のある方,共同研究をご希望の方は,下記フォームよりお問い合わせください.

2021年11月第4週朝活論文紹介

当研究室では毎週月〜木曜日の朝 9:00-10:00 は,研究室のメンバーで集まって英語の論文を読んで紹介するというイベントを行っています.

今週の朝活では,下記論文を紹介しました.

  • Quiz-Style Question Generation for News Stories (from WWW 2021)
  • Understanding and Mitigating Bias in Online Health Search(from SIGIR 2021)
  • Privacy Policies over Time: Curation and Analysis of a Million-Document Dataset (from WWW 2021)
  • Mitigating Gender Bias in Captioning Systems (from WWW 2021)

Quiz-Style Question Generation for News Stories (from WWW 2021)

書誌情報

Adam D. Lelkes, Vinh Q. Tran, and Cong Yu. 2021. Quiz-Style Question Generation for News Stories. In Proceedings of the Web Conference 2021 (WWW 2021). Association for Computing Machinery, New York, NY, USA, 2501–2511.

140 字概要

ニュースに関するクイズ形式のデータセットを構築し,Transformer を用いた質問・回答,不正解選択肢の生成モデルを構築した.PEGASUS と T5 をそれぞれ質問・回答,不正解選択肢の生成に適用し,ROUGE スコアを用いて評価した.

まとめスライド

Quiz-Style Question Generation for News Stories (2).png (126.6 kB)

感想
  • 人間による調整などが行われているものの,ニュースに基づくクイズを自動生成できるということに驚いた.
  • 質問と正解のデータセットから,もっともらしい不正解を生成することができるのがすごいと感じた.これに加えて,ユーザの回答に応じて選択肢を調整するような仕組みができれば,ユーザの学習に大きく貢献すると思った.
  • 不正解選択肢は問題の正解とは違うが文脈的にはあり得るという難しい特徴を持っているのに,自動生成してそれなりの妥当性があることはすごいと思った.
  • 不正解生成に対する評価を,無理に自動ではなく,人間による評価で行っている点が良いと思う.

Understanding and Mitigating Bias in Online Health Search(from SIGIR 2021)

書誌情報

Anat Hashavit, Hongning Wang, Raz Lin, Tamar Stern, Sarit Kraus. 2021. Understanding and Mitigating Bias in Online Health Search .Proceedings of the 44th International ACM SIGIR Conference on Research and Development in Information Retrieval, 10 pages,

140 字概要

ウェブ検索において,治療効果に関するクエリに対して,医学界で見られている正しい回答を半自動で見つける機械学習手法を提案.提案手法は,与えられた症状に対する治療効果について,yes, no, maybe の 3 択で回答する.提案手法を用いると,人間が評価したときと比べて,治療効果について過大評価をしなかった.

まとめスライド

Understanding and Mitigating Bias in Online Health Search.png (136.7 kB)

感想
  • 医療・健康系の悩みについて,正確な情報を知る意義は大きい.健康は人間に一生涯ついて回る問題だからだ.他方,健康効果を謳った怪しい商売が横行している.提案手法を活用することで,知識の無い人が騙されることを防ぐ効果も期待できるのではと考える.
  • 作成した推論モデルを実際にどのように検索エンジンなどに組み込むのかが気になった.実際にユーザが判断するために見るウェブページの情報について,提案した推論モデルを用いて,ウェブページの情報が正しいのかそうでないのかを判断する必要があると思う.
  • 医療系の記事に関する肯定的なバイアスは、情報を容易に得やすい現代だからこそ知識のない一般人を「まぁ大丈夫だろう」という短絡的思考に陥れやすい。心理学的効果で「ネガティブな情報こそ信じやすい」というものがあるが医療というジャンルにおいては半々なようにも感じる。現代のいわば「自主的診断」においてこの問題は早急に解決すべきと考えられる。

Privacy Policies over Time: Curation and Analysis of a Million-Document Dataset (from WWW 2021)

書誌情報

Ryan Amos, Gunes Acar, Elena Lucherini, Mihir Kshirsagar, Arvind Narayanan, and Jonathan Mayer. Privacy Policies over Time: Curation and Analysis of a Million-Document Dataset. In Proceedings of the Web Conference 2021 (WWW 2021). Association for Computing Machinery, New York, NY, USA, 2165–2176.

140 字概要

時系列的なプライバシーポリシーのデータセットを作成し分析した.データセットの分析の結果,プライバシーポリシーは年々長くなっており読みにくくなっている.また,サードパーティのサービスについてはリンクのみを記載するケースが多く,透明性とアクセス性に問題があることがわかった.

まとめスライド

Privacy Policies over Time_ Curation and Analysis of a Million-Document Dataset (1).png (147.5 kB)

感想
  • プライバシーポリシーの時系列的な変化は,その時点でのプライバシーの問題などが反映されており変化を分析するのは興味深いと感じた.広告の表示に Google や Facebook などのサードパーティのサービスを使用している場合,ポリシーにはサービスのリンクを貼ることは個人的には透明性につながると感じるが,ユーザの読む負担が増加するという点が指摘されていた.
  • 感想 2
  • 感想 3

Mitigating Gender Bias in Captioning Systems (from WWW 2021)

書誌情報

Ruixiang Tang, Mengnan Du, Yuening Li, Zirui Liu, Na Zou, Xia Hu: Mitigating Gender Bias in Captioning Systems. International World Wide Web Conference (WWW 2021), pp.633-645, April, 2021.

140 字概要

既存の画像キャプションモデルに含まれるジェンダーバイアスを軽減するため,人物の特徴を表す画像領域に着目する画像キャプション生成モデル GAIC を提案した.実験の結果,GAIC モデルは既存モデルと比較して性別予測の精度が高く,予測した性別の分布が近くなり,人物の領域に注意して予測するようになった.

まとめスライド

スクリーンショット 2021-11-25 10.41.35.png (2.1 MB)

感想

-

  • 今回のモデルでは,人物の画像の背景や服装,所持しているものではなく人物に注目することでジェンダーバイアスを軽減できるというアプローチをとった.これは社会的性別ではなく,生物的性別に焦点を当てようとしているようにも捉えられる. モデルではなく人間が性別を判断するときにも「その人の職業や服装で判断するのではなく,人物そのものを見ることが大切である」というようなことを言われているように思った.
  • 注意する領域を自動で定められるようになると,ジェンダーバイアス以外の問題も解決できるのではないかと思った.
  • 動作のみから男女を推測するのはもちろん良くないので,その点でジェンダーバイアスを軽減することは良いと思った.しかし,男女の差異は見た目だけではないので,トランスジェンダーの受容などに貢献する内容が含まれると良いと思った.