データはどこまで圧縮できるのですか?


▼ページ最下部
001 2010/01/20(水) 00:32:03 ID:cGtotz3/6.
詳しい人教えて

返信する

002 2010/01/20(水) 02:18:58 ID:i.qs63fwp6
可逆圧縮ならすぐ限界がくるよ

返信する

003 2010/01/21(木) 08:59:22 ID:IXmXELFurw
最終的には「いる」「いらない」だから1bit

返信する

004 2010/01/21(木) 19:12:16 ID:2szpYgpd3I
>>3
それは「ある」「なし」しか表してないからデータではない
「対象固有の情報」を最低限含むなら2bit必要

返信する

005 2010/01/21(木) 21:49:44 ID:U0KvBjQKZ2
軍事用の圧縮アルゴリズムは最強らしいぞ。

返信する

006 2010/01/21(木) 21:59:52 ID:xqNYGbrEWs
>>5
そんなのあるの?
もっと詳しく聞かせてよ

返信する

007 2010/01/22(金) 02:53:48 ID:KpfQxC.yoo
↓ ソースコード落ちてた。まだあんまし読んでない。

http://nog0709.hp.infoseek.co.jp/reports.htm...
http://pc12.2ch.net/test/read.cgi/tech/1261746546...

返信する

008 2010/01/22(金) 10:53:38 ID:ZtB52FQypM
1+1+1+1+1+1+1+1+1+1=10

1x10=10
俺様のあるごりずむ体操じゃこれが限界だ。

返信する

009 2010/01/23(土) 08:50:26 ID:Pkfb4PNxZw
「コルモゴロフ複雑性」でググれ。

返信する

010 2010/01/25(月) 19:06:47 ID:n9yDcYyWZE
>>8
あとは文字列を登録する方法ね
A+B+C→P1
H+I →P2
と動的にパターンを登録してパターンイメージ+その参照リストにする

A+B+C+H+I→P1+P2

この方法は時間をかけてパターンを最適化していくほど
圧縮率が向上する

A+B+C→P1
A+B+C+D→P10
→P1=P10の最初から3文字に収束できる

返信する

011 2010/01/28(木) 01:28:40 ID:Yk6zLI0806
>>10
それは、LZ78?

返信する

012 2010/01/29(金) 20:11:11 ID:WbtkhNpiqE
画像なんかだと近似値をつかって
圧縮率をあげられそうだな

返信する

013 2010/01/31(日) 14:20:55 ID:WZhMmWXB0Y
そういえばニコニコ動画に
すごいCGの動画を表示するが、容量が恐ろしく小さいプログラムの映像が上がっていたよな・・・あれも圧縮なのだろうか?

返信する

014 2010/02/01(月) 00:51:22 ID:/6uwkTWSus
メガデモのこと?
あれは圧縮とは違うでしょ。

返信する

015 2010/03/12(金) 19:31:52 ID:aRtFarAE.6
ZPAQていうのが最強らしい

返信する

016 2010/04/03(土) 00:56:59 ID:JNfvFtLwoE
>>13
それはたぶんLANケーブルを抜いたら
表示されなくなると思うよ

返信する

017 2010/04/03(土) 21:37:22 ID:SZYdkKqcsc
肥満なデータは、殆どが水分だから…圧縮可能率が高いな。

返信する

018 2010/04/04(日) 12:26:55 ID:mTf1T/70jU
こういうのは時間かけたら解決するってもんでもないから天才の出現を待つしかないな

返信する

019 2010/04/08(木) 10:54:25 ID:Q.hsDGx4ZE
そんなもん記録媒体の許す限りいくらでも、とも言える。
圧縮物によって圧縮率が違うのは当然でな
圧縮-解凍のルールさえあれば圧縮と言えるから、
逆に言えば、「○○○」をどう掛け算や足し算で倍増させてくかというのに再現が無いように
そのルールがはまる形式ならなんぼでも小さくなるとも言える。

返信する

020 2010/04/10(土) 00:47:10 ID:WAC/C7fYJc
>>19
圧縮というのは情報を識別できる要素を最小化する技術だから
倍増とは全然違うと思うぞ

返信する

021 2010/04/15(木) 10:35:11 ID:aijKmeOT52
論理的な圧縮は今が限界

物理的な体積の圧縮はまだまだつづく

返信する

022 2010/04/17(土) 15:49:56 ID:W6l1OMzOPs
>>19
まずは情報のエントロピーから勉強した方がいいかと。

>>21
>論理的な圧縮は今が限界
フラクタル符号化はどうなった?

返信する

023 2010/05/05(水) 00:47:58 ID:6a.bNjzzP2
2TBのHDDが一万円切りそうで
光ファイバーで通信速度が速くなって
もう圧縮ってあんまり興味なくなってきたな

返信する

024 2010/06/17(木) 09:58:22 ID:Bpd.uLM1SE
>>20 >>22
そういうこといってんじゃなくって、
圧縮率なんてのは、その圧縮対象の特性により、アルゴリズムの能力は変わるわけで
その対象の特性とアルゴリズムの「お約束」次第でどうとでもなるということ
一般的な話として限度なんて話はできないでしょ

お約束が膨大な非常にそれ用に特化したのなら、なんぼでも圧縮できるわけで。

つまり、「あいうえお」という文字列を「あ」と圧縮するアルゴリズムだと
「あいうえお」は「あ」と圧縮できるが、
同じアルゴリズムで「かきくけこ」を圧縮しても「かきくけこ」のままだし
「あいうえおかきくけこ…ん」を圧縮すれば「あ+かきくけこ…ん」と圧縮できるが、ほとんど効果が無い。

ここで「あいうえお…ん」を「あ」と圧縮するアルゴリズムを用いると
51音が「あ」に圧縮できる。

…で、こんな議論意味あんの?って話。
いくらでも圧縮できるじゃんってのはそういうことを言ったわけ

返信する

025 2010/06/18(金) 06:12:24 ID:T5BLmdR5wM
>>24
圧縮済みデータ+展開プログラムが元データよりも小さくなってないと
圧縮したことにはならないよ。だからそのような
展開プログラムに元データが内包されるようなのは圧縮じゃない。

返信する

026 2010/06/19(土) 00:03:31 ID:YVdX5HglK6
>>24
可逆の場合、確かに圧縮対象データの性質によって、適当な方法は異なってくる。
で、世の中にあるどのようなデータに対してもまあまあの圧縮が出来る
汎用的なアルゴリズムは何か?
を考えていくと、限界値の議論が出来るようになるのですよ。

返信する

027 2010/06/19(土) 23:37:59 ID:DebaprLk8o
>>25
>圧縮済みデータ+展開プログラムが元データよりも小さくなってないと

意味不明。最小の場合を述べたまでで
「あいうえおあいうえお」と上記例を2回以上繰り返す元データなら、
「圧縮済みデータ+展開プログラムが元データよりも小さく」なりますがな

LZHでもなんでも最小のデータを圧縮しても
「圧縮済みデータ+展開プログラムが元データよりも小さくなってない」に当然なるし
そういうものでしょう

返信する

028 2010/06/20(日) 01:05:42 ID:NpNc/psxRM:DoCoMo
削除(by投稿者)

返信する

029 2010/06/20(日) 01:26:42 ID:NpNc/psxRM:DoCoMo
>>24
仮に無限容量無限時間あったとして、その膨大なお約束を検索するためキーのサイズはどのくらいになるんだろう?

返信する

030 2010/07/02(金) 15:59:32 ID:fonYcLsLXM
>>24
>つまり、「あいうえお」という文字列を「あ」と圧縮するアルゴリズムだと
>「あいうえお」は「あ」と圧縮できるが、
>同じアルゴリズムで「かきくけこ」を圧縮しても「かきくけこ」のままだし

データの内容で圧縮できる・できないが変わるものを圧縮アルゴリズムと
言っていいのかな?言いたい事はわかるが間違ってるよ。

上記の例は「文字列を排他的な別の記号で置き換える」というのがアルゴリズム
「あいうえお」→「あ」で置き換えるなら、アルゴリズムに該当するのは

 ①置き換える単位を切り出すルール
  (一連の文字列から「あいうえお」という連続した5文字を取り出した理由)
 ②代替記号の作成ルール
  (「あ」という記号を使用する理由)

①②がアルゴリズムになるわけだ。たとえばこんんな感じ

例)①五十音表に基づいて先頭の文字が一致する文字から始まる5文字をとりだす
  ②取り出した最初の1文字を代替記号とする

これは五十音表を各列がランダムに列単位で含まれるデータでしか意味がない
アルゴリズムだがな
 

返信する

031 2010/07/02(金) 23:36:50 ID:l2f0HOayv6
>>24
おまえアホだな

返信する

032 2010/07/03(土) 12:49:08 ID:IPYHzjMc6Q
>>30
>データの内容で圧縮できる・できないが変わるものを圧縮アルゴリズムと
>言っていいのかな?言いたい事はわかるが間違ってるよ。

圧縮アルゴリズムは全てそういうもんですよ。
これはそのアルゴリズムにおける最小のデータを例示してるから圧縮できないだけで
これと同じことがどの圧縮アルゴリズムでも実際には行われている。
その圧縮アルゴリズムにおける最小限度のデータを圧縮にかけたら、同じように圧縮できない。

この例示を100万倍の長さのランダム生成の51音を並べた文字列データで考えてみりゃ分かると思う。これは立派な圧縮アルゴリズムですよ。

分かりやすく説明するために、極端な例をあげてるから分かりにくかったかな?
これは極端な例だけど、どのアルゴリズムであれ、同様の実態があり、
圧縮どこまでできるか?なんて相対化して話せる話題じゃあないよってはなし。

>>31尻馬に乗るだけの反論できないアホはだまっとれ

返信する

033 2010/07/08(木) 20:19:18 ID:rVzSszDBzo:DoCoMo
圧縮は単純な置換じゃないよ
そもそもそれだと膨大な辞書をもってないとダメだし処理量もサイズも指数関数的にでかくなる
(単純な組み合わせの問題)
それに
>ランダム生成の51音...
というのはエントロピーがでかくてすでに圧縮限界にある
こんなのどうやって圧縮するの?

返信する

034 2010/07/17(土) 23:16:15 ID:OyliXPdCqU
>>33
地道にハフマンまたは算術符号

返信する


▲ページ最上部

ログサイズ:14 KB 有効レス数:35 削除レス数:0





情報技術・IT掲示板に戻る 全部 次100 最新50

スレッドタイトル:データはどこまで圧縮できるのですか?

レス投稿

未ログイン (ログイン

↑画像ファイル(jpg,gif,png)