2017-01-01から1年間の記事一覧

JupyterNotebookでの技術書執筆環境を作った

本や記事を書く際、markdownやreSTで書くなど色々な書き方があると思う。 実際に何度かちょっとした記事を書いてみて、プログラムのコードを使った説明が多いような文章だと markdownやreSTにコピペするのがめんどくさいなぁというのがあった。 なのでJupyte…

queryとbool型のSeries指定によるDataFrameのからのデータ抽出速度の差【pandas】

pandasで条件を指定して抽出を行うとき、df[df['Age'] < n]とdf.query('Age < @n') で同じことができるけれど、 どれくらい実行時間に差があるか気になったので調べた。 使用データ 使ったデータ: 2000行弱のデータ。 Colon function | R Documentation impo…

Jenkinsのpipelineのスクリプトの書き方まとめ

Jenkins2.0以降Pipelineが標準機能となり、 ビルド同士の関係もスクリプトで管理しやすくなった。 PipelineのスクリプトはGroovy(JavaVM上で動く動的プログラミング言語)で書く必要があり、 GroovyにもJavaにも明るくない人にとってはちょっとハードルが高い…

EC2(Amazon Linux AMI)へのPostgreSQLのインストールと設定

PostgreSQLの設定にだいぶ手間取ったので、 次からすぐに設定できるようにメモ。 インストール yumにはPostgresSQLが準備されてないので、rpmからとってくる。 今回インストールしたのはPostgresSQL-9.6. wget https://download.postgresql.org/pub/repos/yu…

Deep Learning Acceleration勉強会(# DLAccel)に参加してきたのでまとめ

今日参加してきた Deep Learning Acceleration勉強会 - connpass が非常に面白かった. 一度聞いただけでは全然理解できなかったので、後から読み返すように公開された資料や論文などをメモをまとめた。 私自身は仕事で一度tensorflowでCNN触ってみたくらいで…

Pandasを使ったデータ操作の基本

データ分析の会社に転職してから3ヶ月。 最初の1ヶ月はPandasの扱いに本当に困ったので、 昔メモしてたことを簡単にブログに記録しておく(o ・ω・)ノ 【追記】2017/07/31 0:36 データが一部間違ってたので修正しました Pandasとは pandasでよく使う型 テストデ…

1ヶ月で統計学入門したので「良かった本」と「学んだこと」のまとめ

前回の「ゲームプログラマからデータサイエンティストに転職しました」 の記事でもお話したとおり、5月からデータ解析する人になりました。 とはいえ、データ解析に関しては未経験。 少しでも不安を減らすために、4月の有給消化期間は統計学のお勉強しました…

ゲームプログラマからデータサイエンティストに転職しました

新卒で入社して2年勤めたゲーム会社を4月末で退職し、 ゲームプログラマーからデータサイエンティストにジョブチェンジしました。 だいぶ違う業界への転職で不安もありますが、大学の研究はデータ解析寄りだったので、 どうにかなるといいな〜という気持ちで…

はてなブログのTeX記法で数式を書く時用のチートシートと注意点

はてなブログ(markdown記法)のTeX記法で数式を書こうとしたら 初歩的な数式を書く時点で躓いたので 解決方法を乗せるついでに基本的な数式の書き方をまとめておこうと思う(∩´∀`) はてなブログ(markdown記法)でTeXを書くときの注意点 先に結論を言うと、 は…