WordPress Related Post for Japanese 導入してみた

hiromasaさんのページでWordPress Related Post for Japanese Ver.1.0リリースの案内があって、入れてみよう! と思っていたら早速1.01 (バグフィックスリリース)の案内が。

WordPress Plugins/JSeries » WordPress Related Post for Japanese

というわけで、早速バグフィックス版の1.01をインストールしてみた。

本プラグインは Yahoo! JAPAN Webサービスを利用しているためYahoo! Japan からアプリケーションID を取得する必要があります。

とあったので、早速アプリケーションIDを取得して、管理画面にてIDを登録。
で、投稿にアクセスするたびにwp_morphemeテーブルに形態素解析された結果がINSERTされていく。
これは面白い。

今まではSimple Tagsを使って関連する投稿を表示していた。
Simple Tagsの場合は投稿に付けたタグから引っ張っていたので、まあそれなりの結果は出ていたものの、面白みは無い感じ。
それに比べるとWordPress Related Post for Japaneseは本文を形態素解析した結果から関連する記事を検索しているので、単純なタグから引っ張る方式よりも本来の意味で関連する投稿が表示されるかも。
今のところまだ全投稿の解析が終わっていないので精度は低いので、しばらく放置。こういうときに限ってコンテンツごっそりさらって行くようなbotが来ないんだよなぁ 😛

Yurikoさんがこちらで、Yahoo! API不要のN-gramバージョンを作るかもと書かれているけど、派生バージョンとして色々な解析エンジンが使えるようになると面白いかも。自分的にはY!APIに頼らずローカルで完結するchasen版とかあると面白いかもなあと思った。とても作れるスキルが無いけど  🙁

久しぶりに色々と可能性を感じさせてくれるプラグインがリリースされて何やら楽しい。
hiromasaさん、ありがたく使わせて頂きます。

投稿者:

kuni

サイトの管理人です

「WordPress Related Post for Japanese 導入してみた」への3件のフィードバック

  1. >自分的にはY!APIに頼らずローカルで完結するchasen版とかあると面白いかもなあと思った。

    わたしも Chasen とか MeCab を使いたいのですが、これはサーバー上でソースコードをコンパイルしてビルドするソフトウェアで、サーバー管理者があらかじめバイナリーを用意しておかないといけません。なので、WordPress のプラグインとして作るのは難しいんです。Chasen とか MeCab を PHP に移植してしまえばプラグインとして使えますが、さすがにそれは大変ですので……。

    オール PHP で済ませるには N-gram しかないという判断です。

  2. kuni さん、こんにちは。 ご無沙汰しておりました。

    プラグインいれていただきましてありがとうございます!

    いろいろ解析選べるとおもしろそうですね。 たぶん、バックグラウンド取得とか content に追加する部分というのはこの手のプラグイン処理としては共通になるとおもいます。

    そんなフレームワークから、必要な基底クラスインターフェースをもった各解析のオブジェクトを new して doAnalyze() とかって呼んであげるようにすると、いいかなとかふと思いました。

    自宅サーバつかわれているので、Chasen つかえるんですよね。うらやましいです。 PHP から Chasen 呼び出しもおもしろそうですね。ぜひやってみてください。 🙂

    # このエントリに、「連休最終日は大掃除」って Related ついててなんだろう?とおもってみたら、hiromasa がいてちょっと笑ってしまいました。。

  3. to yurikoさん
    確かに、Chasen, MeCab なんかはかなり環境が限定されてしまうので、ひろまささんの Y! API を利用されるアプローチはいろいろな面で有利なんですよね。
    しかし、 N-gram を用いれば、形態素解析よりも手軽に導入できそうですね。結果として増えてしまいがちなノイズをどう排除していくのか、とか考えると楽しそうです。(大変だとは思いますが…)

    to ひろまささん
    昨晩よりは解析結果が増えてきたので(今で全投稿の50%くらいです)、明らかに精度が増してきました。ホント面白いですね、これは。

    自宅サーバつかわれているので、Chasen つかえるんですよね。うらやましいです。 PHP から Chasen 呼び出しもおもしろそうですね。ぜひやってみてください。

    うひ、、ひろまささんのようにサクッとはいきませんよ、、、
    ただ、地球にも家計にも優しくない自宅サーバをせっかく立ち上げてはいるので、何かしてみたいなあ、という気持ち(だけ…)はあります。

    しかし「連休最終日は大掃除」は失礼しました、、
    ひろまささんの方のページを見ると、trackback spamにしか見えないですね、あれは、、、

コメントを残す

メールアドレスが公開されることはありません。