日経記事の解析に文脈ベクトルを使うための環境整備

ホーム
→
02.紀要 Bulletin of University and Institutes
→
031.商学論集 The commercial review
→
第62巻3・4号 (2016)
→
アイテム表示

dc.contributor.author	吉武, 春光	ja
dc.date.accessioned	2016-05-30T05:26:15Z
dc.date.available	2016-05-30T05:26:15Z
dc.date.issued	2016-03
dc.identifier.issn	0286-3324
dc.identifier.uri	http://repository.seinan-gu.ac.jp/handle/123456789/1302
dc.description.abstract	筆者が取り組んできた「コンピュータを用いた自然言語の意味処理」において、長い間、使われてきた手法は、語の意味を記述し、語の構文に従って、文の意味を合成し、更に、談話の意味も合成する、というものである。しかし、語の意味を１つ１つ記述している作業が膨大であることから、一般に行われているビッグデータ処理では、意味の合成は行わずに、語の出現頻度を統計処理している。そこで筆者も意味の合成を行わない手法を検討することにし、前稿（吉武 2015）において、日本経済新聞社の新聞記事１８年分（1995年1月～2012年12月）を処理する際の日本語WordNetの可能性を検討した。日本語WordNet は、曖昧さ解消に有効であると判明したが、全ての語の意味を日本語WordNet に記述することには無理があるために、別の手法を検討することにした。別の手法として、潜在意味解析 Latent Semantic Analysis(LSA）(Landauer et al. 1998)がある。これは、文章の意味を表すために単語の意味を合成していくのではなく、文章と、そこに出現する単語との間には、共通のトピックとなるような意味があると仮定し、その意味を確率的に抽出するという手法である。本研究では、潜在意味解析の中の１つの手法であるWord2Vec(Mikolov et al. 2013)が、日本経済新聞社の新聞記事の解析に適用可能かの検証に取り組むものである。	ja
dc.language.iso	jpn	ja
dc.publisher	西南学院大学学術研究所	ja
dc.title	日経記事の解析に文脈ベクトルを使うための環境整備	ja
dc.title.alternative	How to use Word2Vec for processing Nikkei articles	en
dc.contributor.transcription	ヨシタケ, ハルミツ	ja-Kana
dc.contributor.alternative	Yoshitake, Harumitsu	en
dc.publisher.alternative	Seinan Gakuin University Academic Research Institute	ja
dc.type.niitype	Departmental Bulletin Paper	ja
dc.identifier.jtitle	西南学院大学商学論集	ja
dc.identifier.volume	62	ja
dc.identifier.issue	3・4	ja
dc.identifier.spage	263	ja
dc.identifier.epage	284	ja
dc.textversion	publisher	ja
jpcoar.creator.nameIdentifierNRID	1000030182744
jpcoar.creatorAffiliation.nameIdentifierKakenhi	37105
dc.teacher.researchmap-id	1000117477
dc.teacher.researchmap-url	read0036653