データはどこまで圧縮できるのですか?


▼ページ最下部
001 2010/01/20(水) 00:32:03 ID:cGtotz3/6.
詳しい人教えて

返信する

※省略されてます すべて表示...
030 2010/07/02(金) 15:59:32 ID:fonYcLsLXM
>>24
>つまり、「あいうえお」という文字列を「あ」と圧縮するアルゴリズムだと
>「あいうえお」は「あ」と圧縮できるが、
>同じアルゴリズムで「かきくけこ」を圧縮しても「かきくけこ」のままだし

データの内容で圧縮できる・できないが変わるものを圧縮アルゴリズムと
言っていいのかな?言いたい事はわかるが間違ってるよ。

上記の例は「文字列を排他的な別の記号で置き換える」というのがアルゴリズム
「あいうえお」→「あ」で置き換えるなら、アルゴリズムに該当するのは

 ①置き換える単位を切り出すルール
  (一連の文字列から「あいうえお」という連続した5文字を取り出した理由)
 ②代替記号の作成ルール
  (「あ」という記号を使用する理由)

①②がアルゴリズムになるわけだ。たとえばこんんな感じ

例)①五十音表に基づいて先頭の文字が一致する文字から始まる5文字をとりだす
  ②取り出した最初の1文字を代替記号とする

これは五十音表を各列がランダムに列単位で含まれるデータでしか意味がない
アルゴリズムだがな
 

返信する

031 2010/07/02(金) 23:36:50 ID:l2f0HOayv6
>>24
おまえアホだな

返信する

032 2010/07/03(土) 12:49:08 ID:IPYHzjMc6Q
>>30
>データの内容で圧縮できる・できないが変わるものを圧縮アルゴリズムと
>言っていいのかな?言いたい事はわかるが間違ってるよ。

圧縮アルゴリズムは全てそういうもんですよ。
これはそのアルゴリズムにおける最小のデータを例示してるから圧縮できないだけで
これと同じことがどの圧縮アルゴリズムでも実際には行われている。
その圧縮アルゴリズムにおける最小限度のデータを圧縮にかけたら、同じように圧縮できない。

この例示を100万倍の長さのランダム生成の51音を並べた文字列データで考えてみりゃ分かると思う。これは立派な圧縮アルゴリズムですよ。

分かりやすく説明するために、極端な例をあげてるから分かりにくかったかな?
これは極端な例だけど、どのアルゴリズムであれ、同様の実態があり、
圧縮どこまでできるか?なんて相対化して話せる話題じゃあないよってはなし。

>>31尻馬に乗るだけの反論できないアホはだまっとれ

返信する

033 2010/07/08(木) 20:19:18 ID:rVzSszDBzo:DoCoMo
圧縮は単純な置換じゃないよ
そもそもそれだと膨大な辞書をもってないとダメだし処理量もサイズも指数関数的にでかくなる
(単純な組み合わせの問題)
それに
>ランダム生成の51音...
というのはエントロピーがでかくてすでに圧縮限界にある
こんなのどうやって圧縮するの?

返信する

034 2010/07/17(土) 23:16:15 ID:OyliXPdCqU
>>33
地道にハフマンまたは算術符号

返信する


▲ページ最上部

ログサイズ:14 KB 有効レス数:35 削除レス数:0





情報技術・IT掲示板に戻る 全部 前100 次100 最新50

スレッドタイトル:データはどこまで圧縮できるのですか?

レス投稿

未ログイン (ログイン

↑画像ファイル(jpg,gif,png)