日記の内容と関連するかも知れないアマゾンの商品を表示する tDiary のプラグインを作った。すでに同じような amazon_search.rb というプラグインがある。この amazon_search.rb は Amazon Search を利用している。残念なことに Amazon Search は遅い。ので、Amazon Search を利用しない同じようなものを作った。
その日の日記から特徴的な単語を抽出して、Amazon で検索して、 Amazon で XML を XSLT 使って HTML に変換してもらうという、超 Amazon 依存形サービス。
Google AdSense は他のコンテンツターゲット広告と同じページに掲載してはいけない。このプラグインがコンテンツターゲット広告あたるかは良く分からない。けど、最新のページでは、Google AdSense を外しておく。最新のページだと AdSense の精度が悪いし。
簡単なコードのわりにはうまくいっている気がする。連続している適当な長さのアルファベットと漢字とカタカナを抜き出す。そしてランダムに選んで検索しているだけ。漢字とアルファベットを優先。カタカナはどうもうまいこと内容とマッチしない。Amazon の検索エンジンは形態素解析が弱いので名詞や固有名詞をちゃんと入力する必要がある。そのためには上のような単純なやり方がいいみたい。
「まつもとゆきひろ」は検出されなくて、「青木峰郎」は検出されるはず。
最近のコメント