May
18
BigData-JAWS 勉強会#7
〜Redshift Spectrum, カラムナストレージ, 大規模データフロー〜
Organizing : リクルートテクノロジーズ 渡部徹太郎
Registration info |
一般参加 Free
Standard (Lottery Finished)
主催者 Free
Standard (Lottery Finished)
|
---|
Description
勉強会の概要
本勉強会は、AWS上でビッグデータ処理をしている(しようとしている)人が、ノウハウ共有・情報交換できる場を目指しています。
セミナではないため、発表者からの一方向の技術紹介やユースケース紹介ではありません。参加者の相互の情報共有を前提としています。
想定する参加者は以下のとおりです
- AWSでビッグデータ処理をしている or しようとしている方
- 話を聞くだけではなく、議論に参加できる方
(勉強会の様子)
議論多めでやっていきたいとおもいます!
日程
5/18(木)
- 開場 18:00
- 勉強会 18:30〜20:30
- 懇親会 20:30〜22:00
場所
アマゾン ウェブ サービス ジャパン 目黒オフィス 東京都目黒区下目黒1-8-1 アルコタワー 19F
タイムテーブル
1.オープニング・支部の説明 (10分)
株式会社リクルートテクノロジーズ ビッグデータ部 渡部徹太郎
2. Redshiftまでの大規模データフロー制御(30分)
NTTドコモ サービスイノベーション部 ビッグデータ担当 鈴木浩之さん
概要:ビッグデータ分析を行うための前処理(ETL)はツールも方法も様々。Redshiftをメインとしたドコモのビッグデータ分析基盤におけるデータ加工などのフロー制御の概要と苦労話を紹介
3. ビッグデータではなぜカラムナストレージを使うべきなのか?(仮)(30分)
Retty.Inc 林田千瑛さん
概要:EMRやAthena等のビッグデータプロダクトを利用する際の定石の一つとして、「カラムナストレージを使う」という事が挙げられます。しかしなぜカラムナストレージを使うべきなのか、その特徴について、お話します。
休憩(10分)
4. Redshift Spectrumを使ってみた話(仮)(30分)
株式会社リクルートテクノロジーズ ビッグデータ部 河野 愛樹さん
概要:先日発表されたばかりのRedshift Spectrum。一足先に利用してみた話をしたいと思います。
5.次回発表のテーマ募集・クロージング(10分)
6.懇親会
AWSさんの会場にて懇親会を行います。会費2000円
ビッグデータについて語りましょう!
資料
資料はGithubに公開します。今までの開催分の資料もあります。
https://github.com/bdjaws/workshop
ビッグデータ支部の紹介
AWS上でビッグデータ処理を行っている(行おうとしている)ユーザを中心としたグループです。
技術やユースケースの共有や、日々の悩みを相談をすることを目的としています。
以下のテーマを想定しています。
- 分散集計(RedShift、EMR、Athena等)
- 機械学習(EMR、Amazon Michine Learning等)
- 分散キュー(kinesis)+ショートバッチ
- 分散KVS(DynamoDB)
- データフロー制御・スケジューリング(SWF,DataPipeline等)
- データマイグレーション(ネットワーク周り、スノーボール等)
- BI (QuickSight)
主催・協力
- 主催:株式会社リクルートテクノロジーズ
- 協力:株式会社NTTドコモ
- 会場提供:アマゾン ウェブ サービス ジャパン株式会社
Media View all Media
If you add event media, up to 3 items will be shown here.