Apakah Jenis Data Amazon Redshift?

Apakah Jenis Data Amazon Redshift



Amazon Redshift ialah penyelesaian awan yang ditawarkan oleh AWS yang memenuhi tujuan gudang data. Gudang data ialah ruang besar dalam awan yang menyimpan sejumlah besar data. Perbezaan antara gudang data dan pangkalan data ialah yang pertama bukan sahaja menyimpan data semasa tetapi juga sejarah lengkap data.

Artikel ini akan mempelajari tentang Amazon Redshift oleh AWS dan jenis data yang disokong oleh perkhidmatan ini.







Apakah Amazon RedShift?

Ia adalah penyelesaian awan kepada pergudangan data yang berasaskan 'PostgreSQL' . Ia menggunakan teknologi yang dipanggil 'Pemprosesan Selari Secara Besar-besaran (MPP)' untuk memproses petabait data pada kelajuan kilat. Ini menyediakan penyelesaian mudah untuk ramalan masa nyata berdasarkan data sejarah dan penyelesaian penstriman.



Angka berikut menunjukkan mekanisme kerja Amazon Redshift:







Penjelasan grafik tentang cara Amazon Redshift berfungsi sangat mudah dan jelas. Ia memberi kami maklumat tentang cara data diambil dan diproses selanjutnya untuk menjana output dan mencipta aplikasi dipacu data.

Seni bina gudang data Amazon Redshift juga boleh dilihat dalam rajah yang diberikan di bawah:



Sekarang, kami akan menuju ke kegunaan dan ciri perkhidmatan ini.

ciri-ciri

Seperti yang telah disebutkan, Amazon Redshift adalah berdasarkan PostgreSQL dan menggunakan teknologi yang dipanggil Pemprosesan Selari Besar-besaran yang membolehkannya memproses petabait data dalam masa yang singkat. Oleh itu, Redshift menawarkan sejumlah ciri dan kegunaan yang baik. Beberapa ciri ini adalah di bawah:

  • Keselamatan dan Penyulitan Data.
  • Analitis Perniagaan.
  • Sokongan Aplikasi dipacu data.
  • Analisis Ramalan.
  • Pengulangan Tugasan Automatik.
  • Penskalaan Data Serentak.
  • Pergudangan Data.

Beberapa ciri tambahan perkhidmatan ini boleh dilihat dalam rajah yang diberikan di bawah:

Ini adalah kebanyakan ciri yang ditawarkan oleh Redshift dan kini kami akan beralih ke jenis data yang disokong oleh perkhidmatan ini.

Jenis Data

Amazon Redshift ialah penyelesaian pergudangan data dengan sejumlah besar ciri. Ia menyokong kedua-dua jenis data berstruktur dan tidak berstruktur. Memandangkan ia berdasarkan PostgreSQL, data boleh dimanipulasi melalui pertanyaan SQL mudah.

Kini, persoalan lain timbul, iaitu, bagaimana format data ini berbeza antara satu sama lain? Mari kita bincangkan kedua-dua format data ini.

Data Berstruktur

Jenis data berformat tinggi yang mudah diterjemahkan oleh algoritma pembelajaran mesin dipanggil data berstruktur. Pangkalan data SQL berfungsi dengan data berstruktur. Data berstruktur adalah dalam bentuk jadual seperti data yang digunakan oleh pangkalan data hubungan

Salah satu sistem pengurusan pangkalan data SQL yang digunakan secara meluas ialah MYSQL. Seni binanya boleh dilihat di bawah dalam rajah yang diberikan:

Data Tidak Berstruktur

Data tidak berstruktur adalah kurang corak dan kurang memformat data seperti data yang digunakan dalam pangkalan data bukan hubungan. MongoDB ialah pangkalan data bukan perhubungan yang terkenal. Pertanyaan SQL tidak berfungsi pada pangkalan data bukan hubungan, jadi pangkalan data ini juga dipanggil pangkalan data NoSQL.

Seperti yang telah disebutkan, MongoDB ialah sistem pengurusan pangkalan data tidak berstruktur dan seni binanya boleh dilihat di bawah dalam rajah yang diberikan:

Kami telah melalui dua jenis data asas yang digunakan dalam pangkalan data dan kini kami akan menuju ke jenis data sebenar yang disokong oleh Amazon Redshift. Jenis data ini ialah:

  • Data berangka
  • Data Watak
  • Data masa tarikh
  • Data Boolean
  • Data HLLSKETCH
  • Data SUPER
  • Data PENGGANTIAN

Mari kita bincangkan jenis data ini:

Data berangka

Jenis data ini adalah jelas. Ia menyokong data dalam bentuk integer, perpuluhan, titik terapung dan jenis data berangka lain.

Ciri-ciri jenis data integer boleh dilihat dalam rajah di bawah:

Jenis data perpuluhan menyimpan data berdasarkan ketepatan daripada pengguna. Ciri-cirinya adalah seperti berikut:

Data Watak

Jenis data CHAR dan VARCHAR berada di bawah kategori jenis data berasaskan aksara. NCHAR dan NVARCHAR juga merupakan jenis data jenis aksara. Tidak seperti CHAR dan VARCHAR, kedua-dua jenis data ini menyimpan panjang tetap, aksara Unicode. Mari kita lihat sifat jenis data ini, seperti:

  • CHAR, CHARACTER, NCHAR mempunyai julat 4KB.
  • VARCHAR, NVARCHAR mempunyai julat 64KB.
  • BPCHAR mempunyai julat 256 Bait.
  • TEXT mempunyai julat 260 Bait.

Data masa tarikh

Jenis data tarikh ialah DATE, TIME, TIMETZ, TIMESTAMP, TIMESTAMPTZ. Keupayaan fungsi jenis data ini adalah seperti berikut:

  • DATE hanya menyimpan tarikh kalendar.
  • TIME menyimpan masa tanpa merujuk kepada mana-mana zon waktu. Ia adalah UTC, secara lalai.
  • TIMETZ menyimpan masa merujuk kepada zon waktu. Ia adalah UTC dalam kedua-dua jadual pengguna dan jadual sistem, secara lalai.
  • TIMESTAMP bukan sahaja termasuk masa tetapi juga tarikh juga. Ia adalah UTC dalam kedua-dua jadual pengguna dan jadual sistem, secara lalai.
  • TIMESTAMPTZ bukan sahaja termasuk masa tetapi juga tarikh. Ia adalah UTC dalam jadual pengguna sahaja, secara lalai.

Data Boolean

Jenis data Boolean ialah jenis data binari, yang bermaksud hanya terdapat dua nilai. Jadual ciri untuk jenis data Boolean diberikan di bawah dalam rajah:

Data HLLSKETCH

Jenis data ini digunakan untuk menyimpan lakaran. Redshift boleh mewakili lakaran dalam bentuk jarang atau padat. Lakaran bermula sebagai jarang dan beransur-ansur bertukar padat apabila format padat memberikan lebih kecekapan dengan mengikuti pautan.

Data SUPER

Jenis data ini berkaitan dengan data tidak berstruktur yang boleh dalam bentuk tatasusunan, struktur bersarang atau JSON. Tiada model atau format data. Pengguna boleh meneroka lebih banyak maklumat dengan menavigasi pautan.

Data PENGGANTIAN

Jenis data ini juga menyimpan aksara. Walau bagaimanapun, panjangnya terhad. Amazon Redshift membenarkan penghantaran data VARBYTE ke dalam mana-mana jenis integer atau data jenis aksara. Untuk mendapatkan maklumat lanjut tentang jenis data ini, ikuti pautan di bawah.

Ini sahaja yang ada untuk Amazon Redshift dan jenis data yang disokongnya.

Kesimpulan

Amazon Redshift ialah perkhidmatan AWS yang dalam bentuk asasnya berfungsi untuk tujuan gudang data tetapi merupakan penyelesaian yang sangat berkuasa dan bercirikan untuk analitik dan ramalan. Artikel ini telah membincangkan Redshift dan jenis data yang disokongnya. Jenis data ini diterangkan secara ringkas bersama ciri-cirinya.