日本語テクスト解析ツール TextImi

39
1 日日日日日日日日日日日日 日日日日日日日日日日日日 TextImi TextImi 日日日日日日日日日日日 日日日日日日日日日日日日日 日日日日日日日日日日日 日日日日日日日日日日日日日 日日日日日日日日[email protected] [email protected]

description

日本語テクスト解析ツール TextImi. 慶應義塾大学大学院政策・メディア研究科後期博士課程 中野智仁( [email protected] ).  言語と世界. 人間とは無関係に言語と世界が対応しているわけではない 言語を用いて人間は世界を理解し、意味づけていく. 世界(外的世界・内的世界). 言語. Mental Representation 心的表象. 何を表現するか( What ) どう表現するか( How ).  意味の社会的構築. - PowerPoint PPT Presentation

Transcript of 日本語テクスト解析ツール TextImi

Page 1: 日本語テクスト解析ツール TextImi

1

日本語テクスト解析ツール日本語テクスト解析ツール TextImiTextImi

慶應義塾大学大学院政策・メディア研究科後期博士課程慶應義塾大学大学院政策・メディア研究科後期博士課程中野智仁(中野智仁( [email protected]@sfc.keio.ac.jp))

Page 2: 日本語テクスト解析ツール TextImi

2

 言語と世界 言語と世界

人間とは無関係に言語と世界が対応しているわけではない

言語を用いて人間は世界を理解し、意味づけていく

世界(外的世界・内的世界)

言語Mental Representation 心的表象

何を表現するか(What)

どう表現するか( How)

Page 3: 日本語テクスト解析ツール TextImi

3

 意味の社会的構築 意味の社会的構築

アイデアや観念は言葉で語られ、言葉で形を与えられる中でなんらかの方向性(つまり言説)を持つようになる。言葉によって、それをどう捉えるか、どういうふうに見るのかのパースペクティブを決めていく。見えないものは言葉によってのみ、語れることによって作られる。

そのようにして作られた「世間」観や「社会」観が曖昧とはいえ多くの日本人に共有され、それぞれの「世間」や「社会」の捉え方にのっとって普段の生活が営まれている。言葉の分析を通じて改めて人々にとっての「世間」や「社会」の実質的なあり方を明らかにすることで、たとえば日本文化に対する考察、日本人の持つ「公共性」の理解といったより大きな分野や研究領域にも寄与する「意味的な視点からの」独自の展開の可能性を提供しうる。

Page 4: 日本語テクスト解析ツール TextImi

4

 社会現象の質的理解への関心 社会現象の質的理解への関心

現場の声・知識現場の声・知識関与するアクターたちの間の意識、認識関与するアクターたちの間の意識、認識コミュニケーションを通じて編成される彼らの知コミュニケーションを通じて編成される彼らの知

さまざまな方法論と手法さまざまな方法論と手法現象学的社会学、シンボリック相互作用論、エスノメソドロジー…現象学的社会学、シンボリック相互作用論、エスノメソドロジー…

 言語分析、言説分析、参与観察、フィールドワーク… 言語分析、言説分析、参与観察、フィールドワーク…

Page 5: 日本語テクスト解析ツール TextImi

5

  データとしてのテクストデータとしてのテクスト

人々の意味づけの痕跡としてのテクスト人々の意味づけの痕跡としてのテクストあることについて人々がそれぞれに言葉をもって発言した内容、表現の記録あることについて人々がそれぞれに言葉をもって発言した内容、表現の記録

ネットワーク技術の進展とテクスト取得量の増加ネットワーク技術の進展とテクスト取得量の増加数千件~数万件の自由回答文(数千件~数万件の自由回答文( FAFA))ネットワーク上のコミュニティにおける投稿ネットワーク上のコミュニティにおける投稿デジタル化された既存のアンケートやインタビュー記録のストックデジタル化された既存のアンケートやインタビュー記録のストック

テクスト分析の範囲の拡大テクスト分析の範囲の拡大大量のテクストデータへの低コストでのアクセス大量のテクストデータへの低コストでのアクセス一部の集団から不特定多数まで、範囲の拡大の可能性一部の集団から不特定多数まで、範囲の拡大の可能性

Page 6: 日本語テクスト解析ツール TextImi

6

 大量テクストの効率的な処理の必要性 大量テクストの効率的な処理の必要性

人間の独力の解釈には余るデータの量人間の独力の解釈には余るデータの量「どういう人のどういう発言がどれだけあったか」「どういう人のどういう発言がどれだけあったか」数千~数万の数の発言からの読み取りの困難数千~数万の数の発言からの読み取りの困難

現状なされている試み:テキストマイニング現状なされている試み:テキストマイニング自然言語処理技術の応用自然言語処理技術の応用形式化されていない自然文を単語などに分割し、その出現頻形式化されていない自然文を単語などに分割し、その出現頻度や相関を解析していく度や相関を解析していく

Page 7: 日本語テクスト解析ツール TextImi

7

 テキストマイニングの基本技術 テキストマイニングの基本技術

テクストの単語単位への分解・定量化テクストの単語単位への分解・定量化

子供に携帯電話を持たせる親が増えた。子供に携帯電話を持たせる親が増えた。[ [[ [子供子供 ],[],[にに ],[],[携帯携帯 ],[],[電話電話 ],[],[をを ],[],[持つ持つ ],[],[せるせる ],[],[親親 ],[],[がが ],[],[増え増えるる ],[],[たた ] ]] ]

テクスト中の単語間の関係からの概観テクスト中の単語間の関係からの概観特定キーワードの増減、相関関係から見る大量データの概要特定キーワードの増減、相関関係から見る大量データの概要表現に対する重み付けを通じての評価点の計算表現に対する重み付けを通じての評価点の計算

Page 8: 日本語テクスト解析ツール TextImi

8

 テキストマイニングの例 テキストマイニングの例

形態素解析によってテキスト形態素解析によってテキスト内の単語を抽出内の単語を抽出

得られた単語をシソーラスを得られた単語をシソーラスを用いてクラスタリング用いてクラスタリング

各クラスターと回答者の属性各クラスターと回答者の属性(性別、年代)のクロス集計(性別、年代)のクロス集計をコレスポンデンス分析をコレスポンデンス分析

松村真宏「松村真宏「 miximixiにおける男女別・年代別の利における男女別・年代別の利用者意識の抽出」第用者意識の抽出」第 2222回ことば工学研究会回ことば工学研究会 , , SIG-LSE-A503, pp.71-81, 2006.SIG-LSE-A503, pp.71-81, 2006.

Page 9: 日本語テクスト解析ツール TextImi

9

 言語分析には適用しづらいテキストマイニング 言語分析には適用しづらいテキストマイニング

実際の意味内容の確認までの困難実際の意味内容の確認までの困難単語や単純な係り受けを基本とした情報のみでは実際の発言におけ単語や単純な係り受けを基本とした情報のみでは実際の発言における意図や評価についての解釈は定まりにくいる意図や評価についての解釈は定まりにくい実際の分析においては結局のところ分析者自身がテクスト原文を読実際の分析においては結局のところ分析者自身がテクスト原文を読み込むという作業が不可欠となってしまうみ込むという作業が不可欠となってしまう→→(作業のコストおよび解釈の恣意性やブレの問題の発生)(作業のコストおよび解釈の恣意性やブレの問題の発生)

結果としての大量テクストの未活用結果としての大量テクストの未活用生データのリスト添付のみ生データのリスト添付のみサンプリングしたうえでの代表的な意見のみの抜粋サンプリングしたうえでの代表的な意見のみの抜粋分析者の主張の傍証として特徴的な意見のみをピックアップ分析者の主張の傍証として特徴的な意見のみをピックアップ

Page 10: 日本語テクスト解析ツール TextImi

10

 問題の整理 問題の整理

ネットワークに蓄積される大量のテクストデータネットワークに蓄積される大量のテクストデータ「大量の」人々の意見・主張・認識の直接的な調査の可能性「大量の」人々の意見・主張・認識の直接的な調査の可能性

大量テクストの処理方法の未発達大量テクストの処理方法の未発達データのあたり付け、概観にのみ有効なテキストマイニングデータのあたり付け、概観にのみ有効なテキストマイニング意味内容にまで踏み込んだ分析は行えず、未活用のテクスト意味内容にまで踏み込んだ分析は行えず、未活用のテクスト

Page 11: 日本語テクスト解析ツール TextImi

11

「意味チャンク」による解析の提案(1)「意味チャンク」による解析の提案(1)

日本語テクスト解析ツール日本語テクスト解析ツール TextImiTextImi

機械は大量データの処理を効率的に行える機械は大量データの処理を効率的に行えるしかし意味の解釈まではおこなえないしかし意味の解釈まではおこなえない

意味の解釈そのものは人間(分析者)自身が行う必要がある意味の解釈そのものは人間(分析者)自身が行う必要があるただし人間に大量のデータを一貫して読み解くという行為は難しいただし人間に大量のデータを一貫して読み解くという行為は難しい

機械は大量テクストの分析の支援として、テクストから人間の解釈機械は大量テクストの分析の支援として、テクストから人間の解釈を妥当に行わせる、より「実質的な意味のまとまり」を解析抽出しを妥当に行わせる、より「実質的な意味のまとまり」を解析抽出し表示する必要がある。表示する必要がある。

Page 12: 日本語テクスト解析ツール TextImi

12

「実質的な意味のまとまり」?「実質的な意味のまとまり」?

言葉の意味は使用の中に現れる言葉の意味は使用の中に現れる他の語との意味的な関係(結合・分節)のなかで始めてその情況におけ他の語との意味的な関係(結合・分節)のなかで始めてその情況における意味が意味づけられるる意味が意味づけられるそして、意味的に関係があるということと、統計的に関係があるというそして、意味的に関係があるということと、統計的に関係があるということはかならずしもイコールではないことはかならずしもイコールではない

人は言葉をどのように意味的に関係付けているのか人は言葉をどのように意味的に関係付けているのか特に動詞と助詞の意味調整的な機能に注目する特に動詞と助詞の意味調整的な機能に注目する動詞の図式構成機能動詞の図式構成機能助詞の操作子機能助詞の操作子機能

Page 13: 日本語テクスト解析ツール TextImi

13

「意味チャンク」による解析の提案(2)「意味チャンク」による解析の提案(2)

意味のまとまり:意味チャンク意味のまとまり:意味チャンクテクスト解析に、以下に定義される単位を用いるテクスト解析に、以下に定義される単位を用いる

 ひとつの受け語(述語)と ひとつの受け語(述語)と 助詞を含むそこに係るすべての( 助詞を含むそこに係るすべての( 00 個以上の)係り語個以上の)係り語 のひとまとまり のひとまとまり

意味チャンクの複合として文を解析する意味チャンクの複合として文を解析する    子供に携帯電話を持たせる親が増えた。子供に携帯電話を持たせる親が増えた。(( 11)) [ [[ [子供子供 , , にに ]-[]-[携帯電話携帯電話 , , をを ]- []- [持つ持つ ] ]] ]

(( 22)) [ [[ [親親 , , がが ]- []- [増えた増えた ] ] ] ]

Page 14: 日本語テクスト解析ツール TextImi

14

Noun + Particle

Predicate

Adverbial relation

Adnominal relation

Meaning Chunk

Compound Meaning Chunk

Page 15: 日本語テクスト解析ツール TextImi

15

• TextIMI deals with text as a set of various MCs.

– (a) – 携帯電話を子供に買い与える親がどんどん増えている。– (Many parents have come to give their children mobile phone.)

– (b-1)– [ [子供 , に ]-[携帯電話 , を ]- [買い与える ] ]– (to buy and give mobile phone to children)– +– (b-2)– [ [親 , が ]- [増えた ] ] – ((the number of ) parents increases)

Page 16: 日本語テクスト解析ツール TextImi

16

Page 17: 日本語テクスト解析ツール TextImi

17

意味チャンクの解析意味チャンクの解析

- 「太郎が次郎に花子を紹介する。」「太郎が次郎に花子を紹介する。」- チャンク構成要素チャンク構成要素

- 述語:「紹介する」述語:「紹介する」- 係り語:「太郎係り語:「太郎 -- が」「次郎が」「次郎 -- に」「花子に」「花子 -- を」を」

- 「花子を太郎が次郎に紹介した。」「花子を太郎が次郎に紹介した。」- チャンク構成要素チャンク構成要素

- 述語:「紹介する述語:「紹介する -- た」た」- 係り語:「太郎係り語:「太郎 -- が」「次郎が」「次郎 -- に」「花子に」「花子 -- を」を」

- 「太郎が弟の次郎に美しい花子を突然紹介した。」「太郎が弟の次郎に美しい花子を突然紹介した。」- チャンク構成要素チャンク構成要素

- 述語:「紹介する述語:「紹介する -- た」た」- 係り語:「太郎係り語:「太郎 -- が」「次郎が」「次郎 -- に」「花子に」「花子 -- を」を」

語順の違いや、副詞形容動詞等の装飾があっても、構成要素のマッチングにより同じチャンクとして抽出される

Page 18: 日本語テクスト解析ツール TextImi

18

意味チャンクの解析意味チャンクの解析

-ファンデーションの使用感想についてのアンケート実文よりファンデーションの使用感想についてのアンケート実文より-(現在使用しているファンデーションの良い点)(現在使用しているファンデーションの良い点)

- 「しっとり 肌になじむ 感じ、粉っぽく浮かない。」「しっとり 肌になじむ 感じ、粉っぽく浮かない。」

- 「 肌に 良く なじむ 。」「 肌に 良く なじむ 。」

- 「自分の 肌になじんでいる 。」「自分の 肌になじんでいる 。」

- 「 肌に よく なじむ 感じが気に入っている。」「 肌に よく なじむ 感じが気に入っている。」

- 「さらっと 肌になじむ ところ。」「さらっと 肌になじむ ところ。」

- 実際の表現としては様々な書き方があるものの、「肌になじむ」というチャンクを含実際の表現としては様々な書き方があるものの、「肌になじむ」というチャンクを含んでいるという点で同様。んでいるという点で同様。- 他の類義語(「なじむ」と似たような意味の動詞等)、表記の揺れを設定し吸収する他の類義語(「なじむ」と似たような意味の動詞等)、表記の揺れを設定し吸収することで、類似の意味内容、意見を機械的に抽出し、集約することができる。ことで、類似の意味内容、意見を機械的に抽出し、集約することができる。

Page 19: 日本語テクスト解析ツール TextImi

19

 テクストからのチャンク解析結果の検索 テクストからのチャンク解析結果の検索

テクストデータの集合

チャンク解析

テクスト内意味チャンクのデータベース(索引)

検索インターフェイス

検索結果の出力

検索条件の指定

Page 20: 日本語テクスト解析ツール TextImi

20

「意味チャンク」による解析の利点(1)「意味チャンク」による解析の利点(1)

小さな文脈のテクストからの抽出小さな文脈のテクストからの抽出言葉と言葉との関係をある程度保持した単位言葉と言葉との関係をある程度保持した単位名詞が助詞、述語と共に抜き出されるからこそ、それがどの名詞が助詞、述語と共に抜き出されるからこそ、それがどのような意味で使われているかについての解釈がそれなりに容ような意味で使われているかについての解釈がそれなりに容易に行われるようになる易に行われるようになる

テクストからの意味解釈の揺れ、恣意性が大幅に縮減されるテクストからの意味解釈の揺れ、恣意性が大幅に縮減されることが期待される ことが期待される

Page 21: 日本語テクスト解析ツール TextImi

21

「意味チャンク」による解析の利点(2)「意味チャンク」による解析の利点(2)

意味内容を保持しつつの自然文の標準化意味内容を保持しつつの自然文の標準化本来複雑な文構造を、ひとつの述語および係る名詞助詞とい本来複雑な文構造を、ひとつの述語および係る名詞助詞という形で標準化することにより、同じような構成要素を持ったう形で標準化することにより、同じような構成要素を持った基礎意味チャンクの集合が整理されて表示される基礎意味チャンクの集合が整理されて表示される

同じような意味内容のチャンクを含むと期待されるテクスト同じような意味内容のチャンクを含むと期待されるテクストが抽出され、テクスト内の意味内容の効率的な集約ができる が抽出され、テクスト内の意味内容の効率的な集約ができる

Page 22: 日本語テクスト解析ツール TextImi

22

Page 23: 日本語テクスト解析ツール TextImi

23

「意味チャンク」による解析の利点(3)「意味チャンク」による解析の利点(3)

解釈の軸としての意味チャンク解釈の軸としての意味チャンク入力に対しての機械の解析は一貫している入力に対しての機械の解析は一貫している

類似の構造(同義の名詞、述語や、助詞の特定のパターン)類似の構造(同義の名詞、述語や、助詞の特定のパターン)を持つ意味チャンクを機械に解析・抽出させることで、ぶれを持つ意味チャンクを機械に解析・抽出させることで、ぶれることのない一定の基準を基に大量テクストの意味内容の解ることのない一定の基準を基に大量テクストの意味内容の解釈を行うことができる釈を行うことができる

Page 24: 日本語テクスト解析ツール TextImi

24

 意味チャンク集合からの意味内容の集約 意味チャンク集合からの意味内容の集約

テクストからの意味チャンクの検索テクストからの意味チャンクの検索特定の語を用いてテクストに書き手が表現した内容を意味チ特定の語を用いてテクストに書き手が表現した内容を意味チャンクの検索やチャンク間の参照関係をたどるャンクの検索やチャンク間の参照関係をたどるそのテクストのテーマにおける同義語や表現の揺れを吸収すそのテクストのテーマにおける同義語や表現の揺れを吸収することで類似の意味チャンクを抽出していくることで類似の意味チャンクを抽出していく

意味チャンクの集合のグルーピング意味チャンクの集合のグルーピング得られたチャンクの集合に対して、同様の内容を語っている得られたチャンクの集合に対して、同様の内容を語っていると解釈、判断できたものにコードを振り、まとめ、テクストと解釈、判断できたものにコードを振り、まとめ、テクスト内の意味内容の構造化を行っていく内の意味内容の構造化を行っていく

Page 25: 日本語テクスト解析ツール TextImi

25

Page 26: 日本語テクスト解析ツール TextImi

26

 意味内容の集約例(1) 意味内容の集約例(1)

通所介護利用者アンケート(社団法人かながわ福祉サービス振興会実施)通所介護利用者アンケート(社団法人かながわ福祉サービス振興会実施)

自由回答質問自由回答質問現在利用している通所介護サービスの現在利用している通所介護サービスの改善してほしい点改善してほしい点

回答期間:平成 13年度~平成 16年度

総回答者数:1922件 ( H13-180件 , H14-849件 , H15-824件)

テクストに含まれる意味チャンク数:8390件

Page 27: 日本語テクスト解析ツール TextImi

27

 意味内容の集約例(2) 意味内容の集約例(2)

頻出単語を含む意味チャン頻出単語を含む意味チャンクの検索を行い、その語がクの検索を行い、その語がどのように語れているかをどのように語れているかを抽出する抽出する

このテクストの場合、全名詞このテクストの場合、全名詞1090610906件のうち、「時間」という件のうち、「時間」という語が一番多く、語が一番多く、 488488件件(△は未回答者の記号)(△は未回答者の記号)

Page 28: 日本語テクスト解析ツール TextImi

28

 意味内容の集約例(3) 意味内容の集約例(3)

「時間」を含む意味チャンクとして「時間」を含む意味チャンクとして

     [[[[ 時間時間 ,,をを ]-[]-[ 長くする長くする ]]]]     [[[[ 時間時間 ,,をを ]-[]-[ 延長する延長する ]]]]

などが頻出する。これらのチャンクを抽出する検索式に対し、などが頻出する。これらのチャンクを抽出する検索式に対し、

「介護サービスの利用時間に関する不満要望」「介護サービスの利用時間に関する不満要望」

としてコードを振るとしてコードを振る

Page 29: 日本語テクスト解析ツール TextImi

29

 意味内容の集約例(4) 意味内容の集約例(4)

ただし、同時に「送迎」や「迎え」、「バス」などを含む意味ただし、同時に「送迎」や「迎え」、「バス」などを含む意味チャンクに関しては、送迎バスの到着時間などに対する不満でチャンクに関しては、送迎バスの到着時間などに対する不満である場合も一覧表から確認されたある場合も一覧表から確認された

「時間」という語が長い、短い、早い、遅いなどの述語と結び「時間」という語が長い、短い、早い、遅いなどの述語と結びついていて、かつ「送迎」や「入浴」、「レクレーション」とついていて、かつ「送迎」や「入浴」、「レクレーション」といった語も含む意味チャンクを抽出し、「別の」時間についていった語も含む意味チャンクを抽出し、「別の」時間について言及するものとして別途妥当なコードを振る言及するものとして別途妥当なコードを振る

Page 30: 日本語テクスト解析ツール TextImi

30

 不満・要望意見の集約結果 不満・要望意見の集約結果

語の出現ランキングにおける名詞上位語の出現ランキングにおける名詞上位 2020件、動詞・件、動詞・形容詞上位形容詞上位 1010件に対して同様の作業をおこなった件に対して同様の作業をおこなった

最終的に最終的に 83908390件の意味チャンクから不満・要望意見件の意味チャンクから不満・要望意見として判断されたのは述べとして判断されたのは述べ 18531853件件

Page 31: 日本語テクスト解析ツール TextImi

31

 不満・要望意見の集約結果 不満・要望意見の集約結果

制度・運営に関する不満・要望意見制度・運営に関する不満・要望意見

代表名代表名「利用時間を延長してほしい」意見数:「利用時間を延長してほしい」意見数: 251251「施設・設備を改善してほしい」意見数:「施設・設備を改善してほしい」意見数: 7575「利用日数・手続きに融通をきかせたい」意見数:「利用日数・手続きに融通をきかせたい」意見数: 4747「職員を増やしてほしい」意見数:「職員を増やしてほしい」意見数: 2626「土日祝日にも利用したい」意見数:「土日祝日にも利用したい」意見数: 2121「職員の入れ替わりが激しい」意見数:「職員の入れ替わりが激しい」意見数: 2020「ショートステイを利用したい」意見数:「ショートステイを利用したい」意見数: 1717

Page 32: 日本語テクスト解析ツール TextImi

32

 不満・要望意見の集約結果 不満・要望意見の集約結果

サービス・プログラムに関する不満・要望意見サービス・プログラムに関する不満・要望意見

代表名代表名「送迎を改善してほしい」意見数:「送迎を改善してほしい」意見数: 116116「リハビリテーションを充実してほしい」意見数:「リハビリテーションを充実してほしい」意見数: 9696「食事を改善してほしい」意見数:「食事を改善してほしい」意見数: 7575「連絡を徹底してほしい」意見数:「連絡を徹底してほしい」意見数: 6767「レクレーションを充実してほしい」意見数:「レクレーションを充実してほしい」意見数: 5151 「入浴を改善してほしい」意見数:「入浴を改善してほしい」意見数: 4545「外出がしたい」意見数:「外出がしたい」意見数: 3535「利用者の個別性を考慮して欲しい」意見数:「利用者の個別性を考慮して欲しい」意見数: 3434「トイレを改善して欲しい」意見数:「トイレを改善して欲しい」意見数: 2020「することがない「することがない // つまらない」意見数:つまらない」意見数: 1717「利用者に過保護すぎる」意見数:「利用者に過保護すぎる」意見数: 1717「専門的なサービスが受けたい」意見数:「専門的なサービスが受けたい」意見数: 1010

Page 33: 日本語テクスト解析ツール TextImi

33

 不満・要望意見の集約結果 不満・要望意見の集約結果

その他 / 特になしその他 / 特になし

代表名代表名「その他」意見数:「その他」意見数: 100100「特になし」意見数:「特になし」意見数: 713713

Page 34: 日本語テクスト解析ツール TextImi

34

 不満・要望意見の集約結果 不満・要望意見の集約結果

Page 35: 日本語テクスト解析ツール TextImi

35

 大カテゴリの経年変化 大カテゴリの経年変化不満・要望意見の構造の変化

Page 36: 日本語テクスト解析ツール TextImi

36

 カテゴリ「制度・運営」内の意味内容の経年変化 カテゴリ「制度・運営」内の意味内容の経年変化

「制度・運営」に関する不満・要望意見比率の経年変化

Page 37: 日本語テクスト解析ツール TextImi

37

 意味内容の集約例(4) 意味内容の集約例(4)

ファンデーションブランド調査(オンラインリサーチ)ファンデーションブランド調査(オンラインリサーチ)

自由回答質問自由回答質問

現在使用しているファンデーションブランドの現在使用しているファンデーションブランドの好きなところ・良いところ・気に入っていると好きなところ・良いところ・気に入っているところを出来るだけ具体的にお知らせくだい。ころを出来るだけ具体的にお知らせくだい。

現在使用しているファンデーションブランドの現在使用しているファンデーションブランドの嫌いなところ・悪いところ・気に入らないとこ嫌いなところ・悪いところ・気に入らないところを出来るだけ具体的にお知らせくだい。ろを出来るだけ具体的にお知らせくだい。

回答期間:2005年 9月 22日~ 2005年 9月 26日

総回答者数:それぞれ 10859件

Page 38: 日本語テクスト解析ツール TextImi

38

 現使用ブランド評価とブランドスイッチ意向 現使用ブランド評価とブランドスイッチ意向

凡例

/ (n=222)無臭 香りがよい

/ / (n=1278)肌になじむ 合うよい

(n=116)のりがよい

/ (n=187)肌にやさしい 安心感がある

(n=464)自分に合っている

(n=113)肌が荒れない

/ (n=587)価格が安い 価格が手頃

/ (n=591)伸びがよい 伸びがある

(n=100)粒子が細かい

(n=160)透明感がある

68.5

63.8

62.9

62.6

61.2

59.3

56.6

56.0

53.0

52.5

31.5

36.2

37.1

37.4

38.8

40.7

43.4

44.0

47.0

47.5

ス イ ッ チ 意 向

な し

ス イ ッ チ 意 向

あ り

凡例

/ (n=73)しっとり感がない 保湿力がない

/ (n=39)透明感がない 透明感に欠ける

(n=59)持ちが悪い

/ (n=351)カバー力がない カバー力が弱い

(n=69)欠点(毛穴・くすみなど)が隠せない

(n=49)のりが悪い

/ /化粧崩れしやすい 化粧崩れが早い ヨれる(n=142)

/ /厚塗りになる 厚つきになる 厚ぼったくなる(n=85)

(n=58)伸びが悪い

(n=34)減りが早い

28.8

30.8

35.6

35.9

36.2

36.7

37.3

37.6

43.1

44.1

71.2

69.2

64.4

64.1

63.8

63.3

62.7

62.4

56.9

55.9

ス イ ッ チ 意 向

な し

ス イ ッ チ 意 向

あ り

良い点・気に入っている点 悪い点・気に入らない点

Page 39: 日本語テクスト解析ツール TextImi

39

 大量テクストからの意味内容の集約 大量テクストからの意味内容の集約

意味チャンクを軸とした分析者の解釈意味チャンクを軸とした分析者の解釈小さな文脈としての意味チャンク小さな文脈としての意味チャンク機械による一貫した意味チャンクの抽出機械による一貫した意味チャンクの抽出人間による柔軟な解釈・カテゴライズの支援人間による柔軟な解釈・カテゴライズの支援

大量の質的情報の活用にむけての、ただ語の分布を見るのではなく、ただ読大量の質的情報の活用にむけての、ただ語の分布を見るのではなく、ただ読み込むのではない、人々それぞれの声を掴み取るテクスト分析ツール・手法み込むのではない、人々それぞれの声を掴み取るテクスト分析ツール・手法

課題・展望課題・展望「解釈」の位置づけ「解釈」の位置づけ分析者(人間)の解釈を前提としその介入を大幅に許す本ツール分析者(人間)の解釈を前提としその介入を大幅に許す本ツール同じデータであっても分析者によって結果が異なりうるなかで、その妥当性同じデータであっても分析者によって結果が異なりうるなかで、その妥当性を機械の一貫性以外の部分でどれだけ確保することができるかを機械の一貫性以外の部分でどれだけ確保することができるか