Apache の Tika と機能的にはかぶる部分もあるので、それを参考にリファクタリングをする予定。
Tika 自体を使う案も考えられるが自前でもった方がコントロールしやすいと考える。
現在の案では、Extractor を別 jar にして、現在、String しか返せないがMapを返すように変更する。