【機械学習アルゴリズム学習備忘録】自然言語処理

Python機械学習アルゴリズム学習備忘録。今回は自然言語処理について。

内容は、Udemy の「【世界で74万人が受講】基礎から理解し、Pythonで実装！機械学習26のアルゴリズムを理論と実践を通じてマスターしよう」で学んだ内容を自分用備忘録としてまとめたものです。

自然言語処理とは
Bags-Of-Wordsの直感的な理解
Pythonによる実装 1 -ライブラリのインポート-
Pythonによる実装 2 -データセットのインポート-
Pythonによる実装 3 -文章のクリーニング-
Pythonによる実装 4 -Bags Of Wordsモデルの作成-
Pythonによる実装 5 – データセットの分割 (訓練用とテスト用)-
Pythonによる実装 6 -分類モデルを使った訓練用データの学習-
Pythonによる実装 7 -テストデータによる結果の予測-
Pythonによる実装8 -混同行列の作成とモデルの評価-

自然言語処理とは

そもそも自然言語処理とは。

自然言語処理（しぜんげんごしょり、英語: natural language processing、略称：NLP）は、人間が日常的に使っている自然言語をコンピュータに処理させる一連の技術であり、人工知能と言語学の一分野である。
https://ja.wikipedia.org/wiki/%E8%87%AA%E7%84%B6%E8%A8%80%E8%AA%9E%E5%87%A6%E7%90%86

自然言語処理自体は、昔からある機械学習の分野の一つで、古くからあるアルゴリズムも多く存在する。

ただ、最近では、昔から存在する自然言語処理の分野とDeep Learning(深層学習)の分野が発展したことで、より複雑な処理を用いて高い精度で処理を行えるようになってきている。

自然言語処理とは

自然言語処理の種類について

1. If/Else Rules (Chatbot)

2. 音声認識

3. Bags-Of-Words model (分類）

4. CNN for Text Recognition (分類）

Bags-Of-Wordsの直感的な理解

Pythonによる実装 1 -ライブラリのインポート-

Pythonによる実装 2 -データセットのインポート-

Pythonによる実装 3 -文章のクリーニング-

Pythonによる実装 4 -Bags Of Wordsモデルの作成-

Pythonによる実装 5 – データセットの分割 (訓練用とテスト用)-

Pythonによる実装 6 -分類モデルを使った訓練用データの学習-

フィーチャースケーリング

ナイーブベイズモデル

決定木

K近傍法

カーネルサポートベクトルマシン

ロジスティック回帰

ランダムフォレスト

サポートベクトルマシン

Pythonによる実装 7 -テストデータによる結果の予測-

Pythonによる実装8 -混同行列の作成とモデルの評価-

共有:

コメント