「MariaDB」の版間の差分

← 古い編集

2026年6月19日 (金) 00:26時点における最新版

MariaDB

MariaDB とはデータ基地を管理するためのApp。C言語製。SQLで基地にあるデータを高速に参照/更新/計算したりできる。アプリは基本的にデータ基地と連携しながら動く。ゆえに、アプリの本質とはデータベース。

当然ながら、MariaDB の公式の説明書、公式チュートリアルは一通り読んでおく。MySQLリファレンスも参照。

セットアップ

設定ファイル etc/my.cnf のモード、所有者、システム変数を確認
/var/lib/mysqlディレクトリの所有者を mysql に変更
ローカル利用ならリモート接続を禁止
日本語入力のズレを解消

$ mysqladmin -u root -p status
$ ss -tan

SHOW VARIABLES LIKE 'char%';
$ vi /etc/my.cnf

[mysqld]
skip-networking
character-set-server = utf8mb4
collation-server = utf8mb4_general_ci

[client]
default-character-set = utf8mb4

[mysql]
default-character-set = utf8mb4

character_set_system は MariaDB の内部システム用の設定だから、utf8mb3 のままでOK

データベースの本質

データベースの本質は「実世界のパラレルワールド」をマシンの中に創造すること。ゆえに、データベースとは人間の認識を反映する鏡だと言える。

実世界（やその状態）を「パラレルワールド」としてマシンの中に複製すると、遠隔マシンにバックアップしたり、自作アプリと連携させたり、AIと抱き合わせて情報分析したりと、色々なことができるようになる。

RDB の場合、主にリレーション（テーブル相互の関係性）という表現手法に沿って実世界（やその状態）を整理しつつパラレルワールド化していくことになる。ちなみに、他の表現手法には NoSQL や DIT などがある。

実世界の「本質」を適切に表現

データベースの活用とはつまり実世界データ構造のパラレルワールド化。ゆえに、実世界を適切に認識し、その本質的な状態を適切にデータベースにアップロードしていく必要がある。

しかし、実世界の本質的な状態とは流動的で常に変化していくもの。この性質をしっかりと踏まえ、将来を見越したデータベース設計をする必要がある。

ゆえに、データ構造パラレルワールド化の際には以下３点が特に大切。

実世界の状態や本質を適切に認識する能力
目的から逆算してデータを整理する能力
その状態を適切に表現する能力

以上３点があれば、その人は適切にデータベースを設計できる。そのような人は自分の部屋と同様にデータたちのお部屋も綺麗に整理することができるはず。

マシンパワーが大前提

データを管理するだけなら別に紙やノートを使っても良いはず。わざわざマシンにデータ管理を任せるのだから「マシンにしかできない何か」を強く期待しているはず。つまり、マシンパワーの活用と目的の実現とのバランスをしっかり前提とした上でテーブル設計やチューニングすることが大切。

データベース設計においては特に、以下２点を強く意識すべき。

マシンパワーの活用を大前提としたデータベース設計
目的から逆算した実世界データ構造のパラレルワールド化

セキュリティ

DELETE FROM mysql.user WHERE User='root' AND Host NOT IN ('localhost');

リモートから root で MariaDB にログインできると危険なので削除。

rootのパスワードリセット

一旦MariaDBのプロセスを落としてからセーフモードで起動、パスワードを設定してMariaDBのプロセスを再度起動させてやるだけ。

# systemctl stop mariadb
# mysqld_safe --skip-grant-tables &
alter user 'root'@'localhost' identified by 'new_passwd';
# systemctl stop mariadb
# systemctl start mariadb

以上。できなかったら「flush privileges」してから。

データベース設計

Database normalization。データベースを正常な状態にしておく。

要点リスト

そのテーブルの主人公は誰（なに）なのかを主キーで明確にする
そのテーブルはどのような「状態」の述語なのかを明確にする
実世界において２つの事柄を同時に認識することはできない
ゆえに認識の鏡であるテーブルにも２つの概念を混ぜてはいけない
２つの概念が混じっているように感じるならテーブルを分けるべき
テーブルを分けた時は外部キーを利用して両テーブルの整合性を保証
１つの変更が多数箇所の修正に結びつく場合もテーブルを分けられるかも
カラムに定義する属性は実世界の「状態」を適切に表現しているべき
例えば、id と cat_no は違う。id は各要素のID、cat_no はカテゴリ番号
でも外部キーを追加するには一意性制約があるので上記２つをまとめても良い
命名はすべて短くて適切で本質的な表現であるべき
１つの「状態」を２度も記述するような冗長なカラム設計は避けるべき
NULL を許すと世界が 3VL になってしまいアプリ設計が非常に複雑になる
NULL を許すとそのテーブルはオプティマイザとの相性が悪くなる
NULL を許すとそのテーブルはインデックスとも相性が悪くなる
NULL が入る余地があるということは DB設計に問題があるかも
NULL 発生を引き起こす「ありえないデータ」は将来、悩みのタネになるかも
SQL にはそもそも順序という概念がないので手続き型ロジックの実装は高負荷
ゆえに、手続き型のロジックに頼るのは最後の手段にする
空間や時系列を表現したいのであれば RDB はやめる

チューニング

扱うデータ量が１００万件程度なら、そもそもマシンに負担はかからないのでチューニングする必要はあまりない。しかし、日頃からチューニングを意識したSQLに慣れておくのは良いこと。

捜索範囲は適切に限定する

データサイズが小さいとパフォーマンス問題は表面化しない。テストはビッグデータで
WHERE句を利用すれば総なめ捜索は回避されるのでマシンリソースを無駄にしない
SELECT int, name など必要なデータだけを取得すればマシンリソースを無駄にしない
捜索データ１億件など、膨大なデータを捜索する場合は利用列にインデックスを作成
かつ、カーディナリティ（値の多様性）が高い列にのみインデックスを作成
インデックスは更新の負担が大きいため無闇矢鱈に作成しない
実際に捜索プランを立てている裏方オプティマイザの働きやすさを意識する

アプリ制作において

トランザクションを開いて閉じる処理を実装したアプリ開発をしてるとSleep増殖ロックかかる時がある
SELECT * は使わない。必要なデータを明示して取得する
データベースを変更しても大丈夫なようにデータアクセスロジックを汎用的にしておく
Abort発生の可能性はゼロにならないので Abort発生に備えてエラー処理は必ず実装しておく
書き込まれるデータの整合性を担保するためにデータ変更はトランザクションを利用する

スレッドプール機能を使う

膨大な数のクライアントからの膨大な数の SQL を処理する場合、スレッドプール機能が役立つ。スレッドプール機能の設定はとても簡単で、稼働中でも動的に設定を変更できる。

# my.cnf
thread_poolmax_threads = 500
thread_pool_idle_timeout = 100000

mysql > show global status like 'threadpool%';

@@ 1行目: / 1行目: @@
-'''SQL''' とはマシンに何か大切なデータ管理を任せたい時に利用する言語。比較的簡単な文章を使ってマシンとデータ管理についてやりとりできる。
+[[ファイル:mariadb-logo.jpeg|thumb|MariaDB|300px]]
+[[ファイル:library.jpg|thumb|データ基地|300px]]
-==よく使うページ==
+'''MariaDB''' とは<strong>データ基地を管理する</strong>ためのApp。C言語製。SQLで基地にあるデータを高速に参照/更新/計算したりできる。アプリは基本的にデータ基地と連携しながら動く。ゆえに、<u>アプリの本質とはデータベース</u>。
-* [[Mysqlリファレンス]]
-* [[Mysqlチューニング]]
-==データベースの本質==
+<strong>当然ながら</strong>、MariaDB の[https://mariadb.org/documentation/ 公式の説明書]、[https://mariadb.com/kb/en/training-tutorials/ 公式チュートリアル] は一通り読んでおく。[[MySQLリファレンス]] も参照。
-データベースの本質は「実世界」のパラレルワールドをマシンの中に創造すること。データベースとは、人間の認識を反映する鏡。
-実世界（やその状態）を「パラレルワールド」としてマシンの中に複製すると、遠隔マシンにバックアップしたり、Webアプリに整形して発展させたり、AIと抱き合わせて情報分析したりと、色々なことができるようになる。
+==セットアップ==
+# 設定ファイル etc/my.cnf のモード、所有者、システム変数を確認
+# /var/lib/mysqlディレクトリの所有者を mysql に変更
+# ローカル利用ならリモート接続を禁止
+# 日本語入力のズレを解消
-RDB の場合、主にリレーション（２次元表）という表現手法に沿って実世界（やその状態）をパラレルワールド化していくことになる。ちなみに、他の表現手法には NoSQL や DIT などがある。
+ $ mysqladmin -u root -p status
+ $ ss -tan
-==データベース設計==
+ SHOW VARIABLES LIKE 'char%';
-データベース設計においては特に、以下２点を強く意識すべき。
+ $ vi /etc/my.cnf
+ [mysqld]
+ skip-networking
+ character-set-server = utf8mb4
+ collation-server = utf8mb4_general_ci
+ [client]
+ default-character-set = utf8mb4
+ [mysql]
+ default-character-set = utf8mb4
+* character_set_system は MariaDB の内部システム用の設定 だから、utf8mb3 のままでOK
-# マシンパワーの活用を大前提としたデータベース設計
+==データベースの本質==
-# 目的から逆算した実世界の状態のパラレルワールド化
+データベースの本質は「<u>実世界のパラレルワールド</u>」をマシンの中に創造すること。ゆえに、データベースとは人間の認識を反映する鏡だと言える。
-===マシンパワーが大前提===
+実世界（やその状態）を「パラレルワールド」としてマシンの中に複製すると、遠隔マシンにバックアップしたり、自作アプリと連携させたり、AIと抱き合わせて情報分析したりと、色々なことができるようになる。
-データを管理するだけであれば別に紙やノートを使っても良いはず。わざわざマシンにデータ管理を任せるのだから「マシンにしかできない何か」を強く期待しているはず。
-つまり、マシンパワーの活用と目的の実現とのバランスをしっかり前提とした上でテーブル設計やチューニングすることが大切。
+RDB の場合、主にリレーション（テーブル相互の関係性）という表現手法に沿って実世界（やその状態）を整理しつつパラレルワールド化していくことになる。ちなみに、他の表現手法には NoSQL や DIT などがある。
 ===実世界の「本質」を適切に表現===
-データベースの活用とはつまり実世界のパラレルワールド化。ゆえに、実世界を適切に認識してその本質的な状態をマシンにアップロードしていく必要がある。
+データベースの活用とはつまり実世界データ構造のパラレルワールド化。ゆえに、実世界を適切に認識し、その本質的な状態を適切にデータベースにアップロードしていく必要がある。
 しかし、実世界の本質的な状態とは流動的で常に変化していくもの。この性質をしっかりと踏まえ、将来を見越したデータベース設計をする必要がある。
-ゆえに、パラレルワールド化の際には以下３点が特に大切。
+ゆえに、データ構造パラレルワールド化の際には以下３点が特に大切。
 # 実世界の状態や本質を適切に認識する能力
@@ 34行目: / 49行目: @@
 # その状態を適切に表現する能力
-以上３点があれば、その人は適切にデータベースを設計できる。そのような人は自分の部屋と同様にデータたちのお部屋も綺麗に整理することができるはず。
+以上３点があれば、その人は適切にデータベースを設計できる。そのような人は<u>自分の部屋と同様にデータたちのお部屋も綺麗に整理</u>することができるはず。
+===マシンパワーが大前提===
+データを管理するだけなら別に紙やノートを使っても良いはず。わざわざマシンにデータ管理を任せるのだから「マシンにしかできない何か」を強く期待しているはず。つまり、マシンパワーの活用と目的の実現とのバランスをしっかり前提とした上でテーブル設計やチューニングすることが大切。
-===具体的なテーブル設計指針===
+データベース設計においては特に、以下２点を強く意識すべき。
+# マシンパワーの活用を大前提としたデータベース設計
+# 目的から逆算した実世界データ構造のパラレルワールド化
+==セキュリティ==
+ DELETE FROM mysql.user WHERE User='root' AND Host NOT IN ('localhost');
+リモートから root で MariaDB にログインできると危険なので削除。
+===rootのパスワードリセット===
+一旦MariaDBのプロセスを落としてからセーフモードで起動、パスワードを設定してMariaDBのプロセスを再度起動させてやるだけ。
+ # systemctl stop mariadb
+ # mysqld_safe --skip-grant-tables &
+ alter user 'root'@'localhost' identified by 'new_passwd';
+ # systemctl stop mariadb
+ # systemctl start mariadb
+以上。できなかったら「flush privileges」してから。
+==データベース設計==
+Database normalization。データベースを正常な状態にしておく。
+===要点リスト===
 * そのテーブルの主人公は誰（なに）なのかを主キーで明確にする
 * そのテーブルはどのような「状態」の述語なのかを明確にする
@@ 43行目: / 85行目: @@
 * ２つの概念が混じっているように感じるならテーブルを分けるべき
 * テーブルを分けた時は外部キーを利用して両テーブルの整合性を保証
+* １つの変更が多数箇所の修正に結びつく場合もテーブルを分けられるかも
 * カラムに定義する属性は実世界の「状態」を適切に表現しているべき
+* 例えば、id と cat_no は違う。id は各要素のID、cat_no はカテゴリ番号
+* でも外部キーを追加するには一意性制約があるので上記２つをまとめても良い
 * 命名はすべて短くて適切で本質的な表現であるべき
 * １つの「状態」を２度も記述するような冗長なカラム設計は避けるべき
@@ 55行目: / 100行目: @@
 * 空間や時系列を表現したいのであれば RDB はやめる
-==データベースの構造==
+==チューニング==
-MairaDB のデータベースシステムは複数のファイル群によって実現される。構成ファイル群は以下のディレクトリに格納されている。
- $ ls -d /usr/local/maria/data/sampledb    ← ソースからインストールした場合
+扱うデータ量が１００万件程度なら、そもそもマシンに負担はかからないのでチューニングする必要はあまりない。しかし、<strong>日頃からチューニングを意識したSQLに慣れておくのは良い</strong>こと。
- $ ls -d /var/lib/mysql/sampledb   ← パッケージからインストールした場合
- $ li -d /usr/local/var/mysql    ← homebrew からインストールした場合
-==インストール==
+===捜索範囲は適切に限定する===
-基本的には公式レポジトリからインストール。例えば、CentOS の場合は /etc/yum.repos.d/MariaDB.repo に公式レポジトリを追加。
+* データサイズが小さいとパフォーマンス問題は表面化しない。テストはビッグデータで
+* WHERE句を利用すれば総なめ捜索は回避されるのでマシンリソースを無駄にしない
+* SELECT int, name など必要なデータだけを取得すればマシンリソースを無駄にしない
+* 捜索データ１億件など、膨大なデータを捜索する場合は利用列にインデックスを作成
+* かつ、カーディナリティ（値の多様性）が高い列にのみインデックスを作成
+* インデックスは更新の負担が大きいため無闇矢鱈に作成しない
+* 実際に捜索プランを立てている裏方オプティマイザの働きやすさを意識する
-[https://downloads.mariadb.org/mariadb/repositories/#mirror=yamagata-university YUM Repository Configuration Generator]
+===アプリ制作において===
+* トランザクションを開いて閉じる処理を実装したアプリ開発をしてると<u>Sleep増殖ロック</u>かかる時がある
+* SELECT * は使わない。必要なデータを明示して取得する
+* データベースを変更しても大丈夫なようにデータアクセスロジックを汎用的にしておく
+* Abort発生の可能性はゼロにならないので Abort発生に備えてエラー処理は必ず実装しておく
+* 書き込まれるデータの整合性を担保するためにデータ変更はトランザクションを利用する
-==セットアップ==
+===スレッドプール機能を使う===
-# 設定ファイル etc/my.cnf のモードや所有者を確認
+膨大な数のクライアントからの膨大な数の SQL を処理する場合、スレッドプール機能が役立つ。スレッドプール機能の設定はとても簡単で、稼働中でも動的に設定を変更できる。
-# 設定ファイル etc/my.cnf のシステム変数などを確認
-# /var/lib/mysqlディレクトリの所有者を mysql に変更
-# ローカル利用ならリモート接続を禁止
-  $ mysqladmin -u root -p status
+  # my.cnf
- $ vi /etc/my.cnf
+ thread_poolmax_threads = 500
+ thread_pool_idle_timeout = 100000
-  [mysqld]
+  mysql > show global status like 'threadpool%';
- character-set-server=utf8
- skip-networking