SlideShare a Scribd company logo
1 of 20
データベースサーバ
現状報告
2015/05/30
@シナジーカフェ GMO YOURS
1
誰?
名前:宇谷有史
ID:@gennei
出身:鳥取の左側
趣味:読書
仕事:エンジニアの端くれ
言語:Python, C#, Ruby
2
論文
3
運行情報
4
参加する
きっかけ
5
きっかけ
•青空文庫の現状説明を聞いて
• エンジニアなしで5台のサーバーを運用
• DBサーバーが止まるとこれまでの青空文庫の
資産がなくなる
• エンジニアがいないので探している
6
なぜ参加するのか
•読書が好き
• 将来青空文庫があってほしい
•青空文庫にある資産は消えたら困る
• 文化資源として
• 研究用資源として
7
データベース
サーバーの現状
8
データベースサーバの中身
PostgreSQLだけではない
いろいろプログラムは存在している
全貌をつかめていない
なので、現在わかっている段階での
DBのお話をします
9
サーバーの現状
OS
Turbolinux Server 10.0
Database
PostgreSQL 8.0.12
PHP
version 4.4
10
Database
Name Encode 備考
aozora EUC_JP メインで利用されていると思われる
aozora2 UTF-8 UNICODE対応した時から
使われていると思われる
aozora_test EUC_JP テストなので必要ない?
aozora_test2 UTF-8 テストなので必要ない?
aozora_test3 UTF-8 テストなので必要ない?
11
Table
18テーブル存在する
10テーブルが作品に関連する情報
3テーブルが著者に関連する情報
残りは青空文庫に協力している方の情報など
本文データはDBに存在しない
12
ER図
13
BookTable
FileTable
底本テーブル
人物
ファイル形式
圧縮形式
関連サイト
以下の機能は使用されていない
View
PL/pgSQL
C言語関数
14
移行してみた
15
移行環境
サーバー
さくらインターネットVPS
OS
CentOS6.6
Database
PostgreSQL 9.4.1
16
移行手順
PostgreSQLのダンプツールを使用
1. pg_dumpall > output_file
2. psql template1 < output_file
上記手順でエラーなく取り込みできた
17
phpPgAdmin導入
18
今後の課題
データベースサーバー
移行に必要なものの洗い出し
移行先の確定
移行を手伝っていただける方の募集
19
? || /**/
20

More Related Content

What's hot

15分で知っとく卒論・修論のための文献収集最終チェック
15分で知っとく卒論・修論のための文献収集最終チェック15分で知っとく卒論・修論のための文献収集最終チェック
15分で知っとく卒論・修論のための文献収集最終チェックYoshida-South Library, Kyoto University
 
坪井創吾さん / "王子様本のRuby1.9対応を調べる"
坪井創吾さん / "王子様本のRuby1.9対応を調べる"坪井創吾さん / "王子様本のRuby1.9対応を調べる"
坪井創吾さん / "王子様本のRuby1.9対応を調べる"toRuby
 
言語学概論9回目
言語学概論9回目言語学概論9回目
言語学概論9回目Kazuya Abe
 
あみぐるみの歴史
あみぐるみの歴史あみぐるみの歴史
あみぐるみの歴史Dai Watanabe
 
Rでを作る
Rでを作るRでを作る
Rでを作るNagi Teramo
 
よわよわエンジニアがde:code 2020に感化されて新しくコミュニティを立ち上げてみた話
よわよわエンジニアがde:code 2020に感化されて新しくコミュニティを立ち上げてみた話よわよわエンジニアがde:code 2020に感化されて新しくコミュニティを立ち上げてみた話
よわよわエンジニアがde:code 2020に感化されて新しくコミュニティを立ち上げてみた話Oshitari_kochi
 
お前の逐モン、GETだぜ!
お前の逐モン、GETだぜ!お前の逐モン、GETだぜ!
お前の逐モン、GETだぜ!Nagi Teramo
 
サト研(仮) とは? - OSC 2013 Fukuoka 勉強会勉強会LT #satoken
サト研(仮) とは? - OSC 2013 Fukuoka 勉強会勉強会LT #satokenサト研(仮) とは? - OSC 2013 Fukuoka 勉強会勉強会LT #satoken
サト研(仮) とは? - OSC 2013 Fukuoka 勉強会勉強会LT #satokenGaryuten
 
FWW_サイト研究会 (仮) の紹介
FWW_サイト研究会 (仮) の紹介FWW_サイト研究会 (仮) の紹介
FWW_サイト研究会 (仮) の紹介Garyuten
 

What's hot (14)

15分で知っとく卒論・修論のための文献収集最終チェック
15分で知っとく卒論・修論のための文献収集最終チェック15分で知っとく卒論・修論のための文献収集最終チェック
15分で知っとく卒論・修論のための文献収集最終チェック
 
15分で解決!ネットにないならILL
15分で解決!ネットにないならILL15分で解決!ネットにないならILL
15分で解決!ネットにないならILL
 
15分でナットク! KULINEから論文検索(2014)
15分でナットク! KULINEから論文検索(2014)15分でナットク! KULINEから論文検索(2014)
15分でナットク! KULINEから論文検索(2014)
 
坪井創吾さん / "王子様本のRuby1.9対応を調べる"
坪井創吾さん / "王子様本のRuby1.9対応を調べる"坪井創吾さん / "王子様本のRuby1.9対応を調べる"
坪井創吾さん / "王子様本のRuby1.9対応を調べる"
 
レポートを書くための文献をあつめよう 2019
レポートを書くための文献をあつめよう 2019レポートを書くための文献をあつめよう 2019
レポートを書くための文献をあつめよう 2019
 
言語学概論9回目
言語学概論9回目言語学概論9回目
言語学概論9回目
 
あみぐるみの歴史
あみぐるみの歴史あみぐるみの歴史
あみぐるみの歴史
 
Rでを作る
Rでを作るRでを作る
Rでを作る
 
よわよわエンジニアがde:code 2020に感化されて新しくコミュニティを立ち上げてみた話
よわよわエンジニアがde:code 2020に感化されて新しくコミュニティを立ち上げてみた話よわよわエンジニアがde:code 2020に感化されて新しくコミュニティを立ち上げてみた話
よわよわエンジニアがde:code 2020に感化されて新しくコミュニティを立ち上げてみた話
 
明解!15分でわかる「京大にない資料」の入手方法
明解!15分でわかる「京大にない資料」の入手方法明解!15分でわかる「京大にない資料」の入手方法
明解!15分でわかる「京大にない資料」の入手方法
 
20101211 #
20101211 #20101211 #
20101211 #
 
お前の逐モン、GETだぜ!
お前の逐モン、GETだぜ!お前の逐モン、GETだぜ!
お前の逐モン、GETだぜ!
 
サト研(仮) とは? - OSC 2013 Fukuoka 勉強会勉強会LT #satoken
サト研(仮) とは? - OSC 2013 Fukuoka 勉強会勉強会LT #satokenサト研(仮) とは? - OSC 2013 Fukuoka 勉強会勉強会LT #satoken
サト研(仮) とは? - OSC 2013 Fukuoka 勉強会勉強会LT #satoken
 
FWW_サイト研究会 (仮) の紹介
FWW_サイト研究会 (仮) の紹介FWW_サイト研究会 (仮) の紹介
FWW_サイト研究会 (仮) の紹介
 

Similar to 青空文庫構成管理サーバー現状報告

bottleで始めるWEBアプリの最初の一歩
bottleで始めるWEBアプリの最初の一歩bottleで始めるWEBアプリの最初の一歩
bottleで始めるWEBアプリの最初の一歩Satoshi Yamada
 
WordPress on PHP7 on CentOS7 on Saraku-VPS
WordPress on PHP7 on CentOS7 on Saraku-VPSWordPress on PHP7 on CentOS7 on Saraku-VPS
WordPress on PHP7 on CentOS7 on Saraku-VPSRyo Shibayama
 
AWSerにも知ってほしいDBの話
AWSerにも知ってほしいDBの話AWSerにも知ってほしいDBの話
AWSerにも知ってほしいDBの話Kenichiro Mori
 
20160416 Azure Data Lakeのはまりどころ
20160416 Azure Data Lakeのはまりどころ20160416 Azure Data Lakeのはまりどころ
20160416 Azure Data Lakeのはまりどころ一希 大田
 
Database on Kubernetes - HA,Replication and more -
Database on Kubernetes - HA,Replication and more -Database on Kubernetes - HA,Replication and more -
Database on Kubernetes - HA,Replication and more -t8kobayashi
 
実践Excelスクレイピング
実践Excelスクレイピング実践Excelスクレイピング
実践Excelスクレイピング宏明 塩原
 
なぜか技術書典5で 3サークルの運営を同時にやった話
なぜか技術書典5で 3サークルの運営を同時にやった話なぜか技術書典5で 3サークルの運営を同時にやった話
なぜか技術書典5で 3サークルの運営を同時にやった話ota42y
 
趣味でのCosmos DBとの付き合い方
趣味でのCosmos DBとの付き合い方趣味でのCosmos DBとの付き合い方
趣味でのCosmos DBとの付き合い方Koichi Ota
 
Goodpatchに生息するbotたち
Goodpatchに生息するbotたちGoodpatchに生息するbotたち
Goodpatchに生息するbotたちdeepblue will
 
ちょっと分かった気になるAzure概要
ちょっと分かった気になるAzure概要ちょっと分かった気になるAzure概要
ちょっと分かった気になるAzure概要Keiji Kamebuchi
 
MF GeeksNight pplogの話
MF GeeksNight pplogの話MF GeeksNight pplogの話
MF GeeksNight pplogの話Naoto Koshikawa
 
グラフデータベース「Neo4j」の 導入の導入
グラフデータベース「Neo4j」の 導入の導入グラフデータベース「Neo4j」の 導入の導入
グラフデータベース「Neo4j」の 導入の導入Hisao Soyama
 
クローズドソースから始めるオープンソース
クローズドソースから始めるオープンソースクローズドソースから始めるオープンソース
クローズドソースから始めるオープンソースTakafumi ONAKA
 
本気でPythonで宛名書きした話
本気でPythonで宛名書きした話本気でPythonで宛名書きした話
本気でPythonで宛名書きした話Satoshi Yamada
 

Similar to 青空文庫構成管理サーバー現状報告 (15)

bottleで始めるWEBアプリの最初の一歩
bottleで始めるWEBアプリの最初の一歩bottleで始めるWEBアプリの最初の一歩
bottleで始めるWEBアプリの最初の一歩
 
WordPress on PHP7 on CentOS7 on Saraku-VPS
WordPress on PHP7 on CentOS7 on Saraku-VPSWordPress on PHP7 on CentOS7 on Saraku-VPS
WordPress on PHP7 on CentOS7 on Saraku-VPS
 
AWSerにも知ってほしいDBの話
AWSerにも知ってほしいDBの話AWSerにも知ってほしいDBの話
AWSerにも知ってほしいDBの話
 
20160416 Azure Data Lakeのはまりどころ
20160416 Azure Data Lakeのはまりどころ20160416 Azure Data Lakeのはまりどころ
20160416 Azure Data Lakeのはまりどころ
 
Database on Kubernetes - HA,Replication and more -
Database on Kubernetes - HA,Replication and more -Database on Kubernetes - HA,Replication and more -
Database on Kubernetes - HA,Replication and more -
 
実践Excelスクレイピング
実践Excelスクレイピング実践Excelスクレイピング
実践Excelスクレイピング
 
なぜか技術書典5で 3サークルの運営を同時にやった話
なぜか技術書典5で 3サークルの運営を同時にやった話なぜか技術書典5で 3サークルの運営を同時にやった話
なぜか技術書典5で 3サークルの運営を同時にやった話
 
趣味でのCosmos DBとの付き合い方
趣味でのCosmos DBとの付き合い方趣味でのCosmos DBとの付き合い方
趣味でのCosmos DBとの付き合い方
 
Goodpatchに生息するbotたち
Goodpatchに生息するbotたちGoodpatchに生息するbotたち
Goodpatchに生息するbotたち
 
ちょっと分かった気になるAzure概要
ちょっと分かった気になるAzure概要ちょっと分かった気になるAzure概要
ちょっと分かった気になるAzure概要
 
ログ勉 Vol.1
ログ勉 Vol.1ログ勉 Vol.1
ログ勉 Vol.1
 
MF GeeksNight pplogの話
MF GeeksNight pplogの話MF GeeksNight pplogの話
MF GeeksNight pplogの話
 
グラフデータベース「Neo4j」の 導入の導入
グラフデータベース「Neo4j」の 導入の導入グラフデータベース「Neo4j」の 導入の導入
グラフデータベース「Neo4j」の 導入の導入
 
クローズドソースから始めるオープンソース
クローズドソースから始めるオープンソースクローズドソースから始めるオープンソース
クローズドソースから始めるオープンソース
 
本気でPythonで宛名書きした話
本気でPythonで宛名書きした話本気でPythonで宛名書きした話
本気でPythonで宛名書きした話
 

Recently uploaded

CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?akihisamiyanaga1
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)Hiroshi Tomioka
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案sugiuralab
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 

Recently uploaded (8)

CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 

青空文庫構成管理サーバー現状報告

Editor's Notes

  1. どんなことをやってきたか
  2. 3.11の震災について書いた論文です。 3.11の震災のために開発されたアプリを収集し、どのようなものが作られたか、どのように作られたかを調査した論文 これだけ通信インフラが発達した国で大きな災害が起きたことはなかったので海外からも興味を持たれました
  3. 震災のときにつくったアプリ Twitterの検索ウィジェットを利用して自分が利用する路線が止まっているかどうかつぶやきを見て判断できるようにした。 それなりにRTされ、初めて会った人に、「あの電車の人ですね」と声をかけられたりしました。 現在はTwitterのAPIのバージョンアップでうごかなくなってしまったので見ることはできません。
  4. 読書が好きなので、自分が未来読みたいと思ったものが登録されていてほしい。 物理的な本にアクセス出来ないような状況になった時(田舎など)ネットさえあればアクセスできたらうれしいから 文学研究や自然言語処理などの研究目的としても使用されているため、その人達の研究を手助けできればいいと思っているから。 あとはコードを書いてよりよい世界になればいいと思っているから
  5. OSの最新版は11。2007年に発売 10.0は2004年に発売されている Database 8.0.12 → 2005年ごろ 最新版は9.4.2
  6. 現在のPostgreSQL内のデータベースです 5つのデータベースが存在する 上2つが使わていると推測される。
  7. 本文データはhtmlと圧縮ファイルで存在している