Rによる自動データ収集
- Webスクレイピングとテキストマイニングの実践ガイ
- 原作: Simon Munzert 原作: Christian Rubba
- 書籍
- 出版社:共立出版
- 発売日: 2017年6月
- Information
- 特典に関するお知らせとご注意
- 中古・ユーズドに関するご注意
- 価格(税込):6,600円
- Vポイント:30pt
-
通常
1~3日で発送
在庫確認の結果、調達が出来ない場合がございます。
発送の目安について
本書は,単にRを使ってインターネットからデータを収集・保存する方法を紹介した入門書ではなく,むしろその後の分析やレポート作成までのすべてのプロセスを効率化あるいは自動化する技法を実践的に解説した専門書である。分析に関連しては,データの前処理に役立つ正規表現や,ドキュメントから統計的な手法によって知見を引き出す技術であるテキストマイニングも取り上げられている。 本書の構成は大きく3つに分かれ,第1部では基本技術に焦点があてられている。Rを利用することでWebスクレイピングとデータ操作は簡単に実現できるが,その背景技術について知識を深めておくと,構造の複雑なWebサイトに遭遇した場合でもデータをピンポイントに抽出できるようになる。続く第2部は,ここまで習得した技術の実践編となっており,現実に遭遇するケースのそれぞれに対処する方法が詳しく紹介されている。そして第3部は,やや複雑な研究課題を想定し,データの収集から分析,そして効果的なグラフィクスの作成までを詳細に解説している。 [原著:SimonMunzert,ChistianRubba,PeterMeissner,DominicNyhuis:AutomatedDataCollectionwithR:APracticalGuidetoWebScrapingandTextMining,Wiley,2015.] ※2017年5月現在のものです |
この商品の説明
著者/アーティスト
原作: Simon Munzert 、 原作: Christian Rubba 、 原作: Peter Meissner 、 原作: Dominic Nyhuis 、 訳者: 石田基広 、 訳者: 工藤和奏 、 訳者: 熊谷雄介 、 訳者: 高柳慎一 、 訳者: 牧山幸史
目次
第1部 Webとデータの技術入門(導入;HTML;XMLとJSON;XPATH;HTTP;AJAX;SQLとリレーショナルデータベース;正規表現と重要な文字列関数);第2部 Webスクレイピングとテキストマイニングのためのツールボックス(Webからのスクレイピング;統計的テキスト処理;データ分析プロジェクトの管理);第3部 事例集(アメリカ上院議員間のコラボレーション・ネットワーク;半構造化されたドキュメントから情報を抜き出す;Twitterによる2014年度アカデミー賞予測;名字の地理的な分布のマッピング;携帯電話のデータを集める;商品レビューのセンチメント分析)
商品仕様
- アイテム名:書籍
- ページ数:567p
- 大きさ:26cm(B5)
- 出版社:共立出版
- ISBN-10:4320124162
- ISBN-13:9784320124165
【お届けの際のご注意】
▼発送時期について
BOOK予約商品のお届けにつきましては直送・店舗受取りにかかわらず、弊社倉庫に届き次第、発送手配を行います。
また、原則として、発売日に弊社の倉庫に到着するため一般の書店よりも数日お届けが遅れる場合がございます。
なお、書籍と書籍以外の商品(DVD、CD、ゲーム、GOODSなど)を併せてご購入の場合、商品のお届けに時間がかかる場合があります。あらかじめご了承ください。
▼本・コミックの価格表示について
本サイト上で表示されている商品の価格(以下「表示価格」といいます)は、本サイト上で当該商品の表示を開始した時点の価格となります。
この価格は、売買契約成立時までに変動する可能性があります。
利用者が実際に商品を購入するために支払う金額は、ご利用されるサービスに応じて異なりますので、
詳しくはオンラインショッピングサービス利用規約をご確認ください。
なお、価格変動による補填、値引き等は一切行っておりません。
■オンラインショッピングサービス利用規約
(1) 宅配サービス:第2章【宅配サービス】第6条において定めます。
(2) TOLピックアップサービス:第3章【TOLピックアップサービス】第12条において定めます。
【サイト表記の書籍カバーについて】
書籍のカバーは、期間限定で変更する場合がございます。
そのためサイト上で表記されたものとお届けした作品のカバーが異なる場合がございます。
カバー違いによる交換は行っておりません。