2010年6月22日火曜日

短縮URLの利点ってなんだ?!

もちろん、URLが短く書ける、っていうのは最大のメリットだろう。
他にも、パラメータ付きのURLを隠蔽できるからアフィリエイトの誘導に使いやすくなるとか。
ブラウザでアクセスしてもらうんだから、アクセス情報が確実に取れる、とか。
色々ありそうね。

特にアフィリエイトへの誘導に関しては、運営側にメリットをもたらす可能性があると思う。
短縮URLとアフィリエイトを融合させて、アクセス解析やIP分布調査などと併用すれば、かなり質の高いサービスを提供できる可能性がある。
しかも、アフィリエイトがからめば、短縮URL自体を有料サービスにもっていける可能性も出てくるわけだ。
なかなか興味深い。


急ごう。

2010年6月21日月曜日

個人的に

ちょっと思い立って、個人的に短縮URLのサービスを作ってみようかと思う。
短縮URLって要はリダイレクト機能なので、そこに込められた可能性ってまだまだ発掘し尽されてない気がするんだよね。

そんな感じです。

しばらく忙しくなるな!

2010年6月18日金曜日

youtube gdata API

最後の仕上げに youtubeのAPIから情報を取得するモジュールを調べてる。
けど、なんだこれ。
I/Fの仕様はきっちり決まっててドキュメントもあるかわ、実装自体は楽なんだけど、動作がイチイチ怪しい。
inboxに入ってるメッセージの一覧を取ろうとしてるんだけど、何も返って来ない。
自分のチャンネルに登録してある動画の再生回数を調べようとしたら、どうやっても0しか返って来ない。
んー。動画のフィード自体は正常に取れるみたいだから、登録した動画のフィードをひとつずつ取って、再生回数カウントしていけばいいんだけど、inboxの方はどうしようもないね。
gmail経由でデータ取るしかないのかなぁ。

参考URL:
http://code.google.com/intl/ja/apis/youtube/developers_guide_php.html
http://code.google.com/intl/ja-JP/apis/youtube/reference.html

2010年6月17日木曜日

mixiのAPI

もうね、すんごいウザっ!

本文にURLをつけるとですね、かなりの確率ではじかれます。
URLの長さなのか、ドメイン判別してるのか知らないけど。
はじかれるだけならいいんだけど、POSTできない、っていうんじゃなくて、空のデータがPOSTされちゃう。
困るよね、こんな仕様。

受け付けないならブロックしろよ、と。

URL短縮しちゃえば問題ないんだけどね。

bit.lyよ、お前モカ

URL短縮でよく使われる有名な bit.lyですが、このほど、APIへのアクセスでエラーが多発するようになりました。

(#208) You have exceeded your hourly rate limit for this method.

ぐはっ使いすぎ、でつか。
もう自前でつくろうかな・・・

全文検索とmecab

今、いろんな仕事と平行して走ってるプロジェクトがあって、そこではpostgresqlで全文検索を行うために mecab を使ってアレコレしてる。
この全文検索、なかなかクセ者で、明らかにマッチするであろう単語は期待通りにマッチすることが多い。
でも、マッチしないであろう単語が意外にもマッチしてしまったり、期待してたのと違うレコードがマッチしたりするから、さあタイヘン。

今朝クレームが来たのは、「ほげほげ」って入れて検索すると何にもマッチするはずないのに180件もヒットしたんですけど!っていう内容。
で、ちょこっと調べてみた。

[psql]
database=# explain select keyword from csv_data_rows__2 where to_tsvector('japanese', keyword) @@ to_tsquery('japanese', 'ほげほげ');
QUERY PLAN
-------------------------------------------------------------------------------------------------
Bitmap Heap Scan on csv_data_rows__2 (cost=44.78..247.91 rows=57 width=226)
Recheck Cond: (to_tsvector('japanese'::regconfig, c29) @@ '''ほる'' & ''ほる'''::tsquery)
-> Bitmap Index Scan on idx_csv_data_rows__2_gin (cost=0.00..44.77 rows=57 width=0)
Index Cond: (to_tsvector('japanese'::regconfig, c29) @@ '''ほる'' & ''ほる'''::tsquery)
(4 rows)

「ほげほげ」が「ほるほる」に変化しとるwww
んじゃぁってんでmecabに直接かけてみた。

sh-# echo ほげほげ | mecab
ほ 動詞,自立,*,*,五段・ラ行,体言接続特殊2,ほる,ホ,ホ
げ 名詞,接尾,一般,*,*,*,げ,ゲ,ゲ
ほ 動詞,自立,*,*,五段・ラ行,体言接続特殊2,ほる,ホ,ホ
げ 名詞,接尾,一般,*,*,*,げ,ゲ,ゲ
EOS

ふむふむ。
コレによると、「ほげほげ」っていうワードは分解、解析されて、たいていの「ほ」からはじまる単語にマッチしてしまいそうだ。
単純に「ほ」で検索した場合よりも件数が少ないので、他にも条件はあるんだろうけど。

辞書をマッシュアップすればマシになるんだろうけど、そこまでする仕事じゃないしな。

「仕様です」で乗り切ろう。

2010年6月16日水曜日

facebook

最近、facebookのAPIにフィードをPOSTすると、

(#341) Feed action request limit reached

っていうエラーが返ってくるようになった。しかもある特定のアカウントだけ。
色々調べてみたけど、1日にPOSTできるフィードの数が決まってんだよ、とか、facebookのバグだとか、色々書いてあって、結局原因も解決策もわからない。
でも、自分のアカウントで試してみたけど、一度に20件くらいフィードをPOSTしてもこんなエラーは出てこない。
あと考えられるのは、アカウント情報が間違ってるとか?

と思ってお客さんに、oauthの認証をやり直してもらった。

うまくいったみたい。
なんなんだよ。

php => pop + gmail (続々)

書くの忘れてた。

gmailにpopでログインするときに、ユーザ名に recent: ってつけると、既読、未読関係なく最近の何件かを返してくれる。

同じことを youtubeでもやりたいんだけど、こっちはできないんだよなぁ。そもそもPOPアクセスじゃないしなぁ。
困ったもんだ。