前回の「【AWS】【機械学習】Deep Learning AMI(Ubuntu)で【形態素解析】を試した【Part.1】」では、環境を設定しましたが「Part.2」では Python から「形態素解析」を試してみます。
前回の記事
【AWS】【機械学習】Deep Learning AMI(Amazon Linux)を試した
【AWS】【機械学習】Deep Learning AMI(Ubuntu)で【形態素解析】を試した【Part.1】
【AWS】【機械学習】Deep Learning AMI(Ubuntu)で【形態素解析】を試した【Part.2】
【AWS】【機械学習】Deep Learning AMI(Ubuntu)で【形態素解析】を試した(Janomeのインストール)【Part.3】
【AWS】【機械学習】Deep Learning AMI(Ubuntu)で【形態素解析】を試した(Janome&mecab-ipadic-neologd で解析)【Part.4】
簡単な形態素解析プログラム
以下簡単な形態素解析プログラム例です。
ubuntu@AWS_TEST deeplearning] vi ma-mecab.py import MeCab |
上記プログラムを実行します。
ubuntu@AWS_TEST deeplearning] python3.6 ma-mecab.py ubuntu@AWS_TEST deeplearning] |
ここまで実行して気が付いたのですが、前回の記事でインストールした「mecab-ipadic-neologd」が利用されていません。
Python プログラムを改修します。
【改修後のプログラム】
ubuntu@AWS_TEST deeplearning] cat ma-mecab.py import MeCab |
【プログラム実行結果】
ubuntu@AWS_TEST deeplearning] python3.6 ma-mecab.py ubuntu@AWS_TEST deeplearning] |
名詞を区切る個所が前よりも自然になりました。
(かなり最新まで固有名詞を認識させることができるようになりました)
参考にした書籍
現在以下の書籍で機械学習のさわり部分を勉強しています。
まだまだ学ぶべき部分は多いですが、「Pythonによるスクレイピング&機械学習 開発テクニック」は機械学習のための様々なライブラリを分かりやすく解説しています。
専門的な部分まで取り扱っていませんが、機械学習初心者にとって、本書は入り口としては最適だと思います。
いきなり難しい専門書を読んでもすぐに挫折すると思うので、最初にこの本を読んでおくのがいいと思います。
Pythonによるスクレイピング&機械学習 開発テクニック BeautifulSoup,scikit-learn,TensorFlowを使ってみよう
今までの記事
【AWS】【機械学習】Deep Learning AMI(Ubuntu)で【形態素解析】を試した【Part.1】
【AWS】【機械学習】Deep Learning AMI(Ubuntu)で【形態素解析】を試した【Part.2】
【AWS】【機械学習】Deep Learning AMI(Ubuntu)で【形態素解析】を試した(Janomeのインストール)【Part.3】
【AWS】【機械学習】Deep Learning AMI(Ubuntu)で【形態素解析】を試した(Janome&mecab-ipadic-neologd で解析)【Part.4】
コメント