Skip to content

[WIP] Add Japanese translation of Data Wants to Be Free #617

New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Draft
wants to merge 6 commits into
base: main
Choose a base branch
from

Conversation

lidavidm
Copy link
Member

No description provided.

@lidavidm
Copy link
Member Author

Thank you for the fast review!!


## PostgreSQL対Arrow:データシリアライズ

[PostgreSQLのバイナリーフォーマット](https://www.postgresql.jp/document/current/html/sql-copy.html#id-1.9.3.55.9.4)と[Arrow IPC](https://arrow.apache.org/docs/format/Columnar.html#serialization-and-interprocess-communication-ipc)を同じデータセットに比較します。
Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Suggested change
[PostgreSQLのバイナリーフォーマット](https://www.postgresql.jp/document/current/html/sql-copy.html#id-1.9.3.55.9.4)[Arrow IPC](https://arrow.apache.org/docs/format/Columnar.html#serialization-and-interprocess-communication-ipc)を同じデータセットに比較します
[PostgreSQLのバイナリーフォーマット](https://www.postgresql.jp/document/current/html/sql-copy.html#id-1.9.3.55.9.4)[Arrow IPC](https://arrow.apache.org/docs/format/Columnar.html#serialization-and-interprocess-communication-ipc)を同じデータセットで比較します

## PostgreSQL対Arrow:データシリアライズ

[PostgreSQLのバイナリーフォーマット](https://www.postgresql.jp/document/current/html/sql-copy.html#id-1.9.3.55.9.4)と[Arrow IPC](https://arrow.apache.org/docs/format/Columnar.html#serialization-and-interprocess-communication-ipc)を同じデータセットに比較します。
この比較で、Arrowは(後知恵のおかげで)前任者より適切のトレードオフを行うのを証明します。
Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

"後知恵" has a negative impression in Japanese. How about using other wording?

"先人たち" will be better than "前任者" for "predecessors" here. BTW, there is a proverb "先人の知恵" in Japanese.

Suggested change
この比較で、Arrowは(後知恵のおかげで)前任者より適切のトレードオフを行うのを証明します
この比較で、Arrowは(先人たちの知恵を使って)先人たちよりも適切なトレードオフを選択することを証明します

[PostgreSQLのバイナリーフォーマット](https://www.postgresql.jp/document/current/html/sql-copy.html#id-1.9.3.55.9.4)と[Arrow IPC](https://arrow.apache.org/docs/format/Columnar.html#serialization-and-interprocess-communication-ipc)を同じデータセットに比較します。
この比較で、Arrowは(後知恵のおかげで)前任者より適切のトレードオフを行うのを証明します。

PostgreSQLでクエリを実行すると、クライアント(すなわちドライバ)はPostgreSQLの通信プロトコルでクエリを送り、結果を受けます。
Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Suggested change
PostgreSQLでクエリを実行すると、クライアント(すなわちドライバ)はPostgreSQLの通信プロトコルでクエリを送り、結果を受けます
PostgreSQLでクエリを実行すると、クライアント(すなわちドライバ)はPostgreSQLの通信プロトコルでクエリを送り、結果を受けとります

この比較で、Arrowは(後知恵のおかげで)前任者より適切のトレードオフを行うのを証明します。

PostgreSQLでクエリを実行すると、クライアント(すなわちドライバ)はPostgreSQLの通信プロトコルでクエリを送り、結果を受けます。
そのプロトコルの内に、結果セットはPostgreSQLのバイナリーフォーマットでエンコードされています[^textbinary]。
Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Suggested change
そのプロトコルの内に、結果セットはPostgreSQLのバイナリーフォーマットでエンコードされています[^textbinary]
そのプロトコルの内で、結果セットはPostgreSQLのバイナリーフォーマットでエンコードされています[^textbinary]

PostgreSQLでクエリを実行すると、クライアント(すなわちドライバ)はPostgreSQLの通信プロトコルでクエリを送り、結果を受けます。
そのプロトコルの内に、結果セットはPostgreSQLのバイナリーフォーマットでエンコードされています[^textbinary]。

[^textbinary]: テキストフォーマットもあります。クライアントはそのフォーマットをほとんど使っています。この記事でテキストフォーマットを論じません。
Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

We can close "ほとんど" and "クライアント" for "many clients".

"論じる" is a good translation for "discuss" but it's a bit formal here. "議論する" or "扱う" (a bit free translation) will be better than "論じる" here.

Suggested change
[^textbinary]: テキストフォーマットもあります。クライアントはそのフォーマットをほとんど使っています。この記事でテキストフォーマットを論じません
[^textbinary]: テキストフォーマットもあります。ほとんどのクライアントはデフォルトでテキストフォーマットを使っています。この記事ではテキストフォーマットを扱いません

列が増えれば増えるほど、オーバーヘッドの比率が減ります。
(しかし、行が増えればオーバーヘッドが変わりません。)
極限において、50%オーバーヘッドに近づきます。
エンディアン交換は高価な操作ではありませんが、それでも必要です。
Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

"高価" isn't storage here but "重い" (heavy) may be easier to understand here.

Suggested change
エンディアン交換は高価な操作ではありませんが、それでも必要です。
エンディアン交換は高価な操作ではありませんが、それでも必要です。

こういう技術は結構高価です。

Arrowはどうでしょうか?
[ADBC](https://arrow.apache.org/adbc/current/driver/postgresql.html)でPostgreSQLテーブルを読み込み、そして前の通りにデータに注釈を付けます。
Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Suggested change
[ADBC](https://arrow.apache.org/adbc/current/driver/postgresql.html)でPostgreSQLテーブルを読み込み、そして前の通りにデータに注釈を付けます
[ADBC](https://arrow.apache.org/adbc/current/driver/postgresql.html)でPostgreSQLテーブルを読み込み、そして前と同じようにデータに注釈を付けます

00000210: <span class="a-data">67 65 72 20 73 74 72 69 ger stri</span>
00000218: <span class="a-data">6e 67 79 65 74 20 61 6e ngyet an</span>
00000220: <span class="a-data">6f 74 68 65 72 20 73 74 other st</span>
00000228: <span class="a-data">72 69 6e 67</span> <span class="a-padding">00 00 00 00</span> <span class="a-data">ring</span><span class="a-padding">.... アラインメントのためのパッディング</span>
Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

In general, "パディング" is used for padding in Japanese.

Suggested change
00000228: <span class="a-data">72 69 6e 67</span> <span class="a-padding">00 00 00 00</span> <span class="a-data">ring</span><span class="a-padding">.... アラインメントのためのパッディング</span>
00000228: <span class="a-data">72 69 6e 67</span> <span class="a-padding">00 00 00 00</span> <span class="a-data">ring</span><span class="a-padding">.... アラインメントのためのパディング</span>


一見すると、Arrowは結構わかりにくいです。
データセットに全然関係なさそうなヘッダーもあるし、
まるで領域を占有するためにだけそうで謎のパッディングもあるし。
Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Suggested change
まるで領域を占有するためにだけそうで謎のパッディングもあるし
まるで領域を占有するためだけそうな謎のパディングもあるし

一見すると、Arrowは結構わかりにくいです。
データセットに全然関係なさそうなヘッダーもあるし、
まるで領域を占有するためにだけそうで謎のパッディングもあるし。
しかし大事なのは、**オーバーヘッドが固定です**。
Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Suggested change
しかし大事なのは**オーバーヘッドが固定です**
しかし大事なところは**オーバーヘッドが固定というところです**

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

2 participants