2013年10月3日木曜日

テキスト視覚化

パターン1

https://github.com/jdf/cue.language
https://github.com/vcl/cue.language

wordcram.0.6.0\WordCram\library\cue.language.jar
に日本語を追加
cue.language\src\cue\lang\stop\StopWords.java
cue.language\src\cue\lang\stop\japanese

http://processing.org/
http://wordcram.org/

wordcram.0.6.0\WordCram\examples\OtherExamples\usConstitution\usConstitution.pde



パターン2
Source Code Word Cloud Generator
日本語テキストは、UTF-8にすること


パターン3
テキスト視覚化アナリティクス・アプリケーションを構築する



  • エントリーレベルのツール
    • 1. Excel
    • 2. CSV/JSON
  • オンラインのビジュアライゼーション
    • 3. Google Chart API
    • 4. Flot
    • 5. Raphaël
    • 6. D3
    • 7. Visual.ly
  • インタラクティブなGUIコントロール
    • 8. Crossfilter
    • 9. Tangle
  • マッピング
    • 10. Modest Maps
    • 11. Leaflet
    • 12. Polymaps
    • 13. OpenLayers
    • 14. Kartograph
    • 15. CartoDB
  • グラフ用のフォント
  • 本格的に取り組む
    • 16. Processing
    • 17. NodeBox
  • プロ・ツール
    • 18. R
    • 19. Weka
    • 20. Gephi


データドリブンな時代を『データ柔術』で生き残ろう
第2回 「マーケティングプロセスとオープンソース・ソフトウエア」

2.日本語テキストマイニング用のOSS
2-1.KHCoder
2-2.MeCab+R(RMeCab)
2-3.Tiny Text Miner
3.ネットワーク解析用のOSS
3-1.Gephi
3-2.NodeXL
3-3.igraph(Rのパッケージ)

0 件のコメント: