Cara organisasi berfikir tentang data dan cara mereka mengakses maklumat yang boleh dipercayai berubah dengan cepat. Permintaan untuk cerapan berkembang dengan pesat dan strategi untuk mengurus data dengan lebih cekap sedang muncul. Di tengah-tengah perubahan ini adalah peralihan minda secara beransur-ansur. Organisasi mula memikirkan data sebagai produk, tawaran berpakej yang boleh diguna semula dan diperhalusi. Pendekatan ini menjauhkan diri daripada pemikiran berasaskan projek di mana setiap permintaan untuk data dipenuhi dengan saluran paip data sekali sahaja yang baharu.
Seperti mana-mana produk, cara produk data direka bentuk dan dipersembahkan kepada pengguna membuat perbezaan yang ketara. Sekarang mari lihat cara mereka bentuk produk data yang elegan.
Apabila kita bercakap tentang produk data, kita merujuk kepada mereka dalam konteks strategi IT atau jaringan data yang lebih besar. Ini tidak boleh dikelirukan dengan produk data sebagai sebahagian daripada strategi perniagaan teras di mana produk data yang menyasarkan pelanggan ialah penjana hasil utama organisasi. Kami tidak bercakap tentang produk data seperti Google Analytics atau Bloomberg.
“kombinasi data, metadata, semantik dan templat yang dipilih susun dan serba lengkap. Ia termasuk logik akses dan pelaksanaan yang diperakui untuk menangani senario perniagaan tertentu dan penggunaan semula. Produk data mestilah sedia penggunaan (dipercayai oleh pengguna), sentiasa dikemas kini (oleh pasukan kejuruteraan) dan diluluskan untuk digunakan (ditadbir). Produk data membolehkan pelbagai kes penggunaan data dan analitis (D&A), seperti perkongsian data, pengewangan data, analitik domain dan penyepaduan aplikasi.”
Takrifan yang sangat terperinci dan kompleks ini mungkin tepat; walau bagaimanapun, takrifan yang lebih elegan mungkin datang daripada J. Majchrzak yang mentakrifkan produk data sebagai "unit data berautonomi, dioptimumkan baca, terstandard yang mengandungi sekurang-kurangnya satu set data (Domain Dataset), dicipta untuk memenuhi keperluan pengguna".
Walaupun kedua-dua definisi adalah tepat, satu adalah lebih mudah dan lebih mudah untuk digunakan. Begitu juga, produk data yang elegan adalah lebih mudah untuk digunakan dan oleh itu berharga.
Bagaimanakah kita tahu sama ada reka bentuk itu elegan? Albert Einstein dikreditkan dengan berkata, "Semuanya harus dibuat semudah mungkin, tetapi tidak lebih mudah." Oleh itu, produk data yang elegan mestilah semudah mungkin untuk mendapatkan hasil yang terbaik.
Mari lihat penyelesaian elegan yang mesti ada:
Mengapa reka bentuk yang elegan penting? Kurang kerumitan menjadikan perkara lebih mudah dan menyeronokkan untuk dimakan, memacu nilai yang lebih besar. Penyelesaian yang mudah tetapi berkesan akan mengatasi kerumitan.
Langkah pertama untuk mereka bentuk dan mencipta produk data yang elegan adalah dengan menggunakan minda produk data. Selalunya, ini boleh menjadi halangan terbesar.
Untuk mengguna pakai minda produk data, anda perlu menyingkirkan minda projek. Ini adalah idea bahawa setiap kali permintaan data diterima oleh kumpulan kejuruteraan data, projek baharu dibuat dan dilaksanakan. Pemikiran projek ini jauh lebih reaktif, dengan jurutera data sentiasa berebut untuk membina saluran data mengikut keperluan pihak berkepentingan. Sebaik sahaja satu projek selesai, sudah tiba masanya untuk melupakannya dan teruskan ke projek seterusnya.
Pemikiran produk telah berkembang. Jurutera data, penganalisis dan pengurus data berfikir secara lebih proaktif tentang data. Daripada menunggu permintaan data ad-hoc, penganalisis, jurutera dan pengurus bekerjasama untuk mencipta produk data sebelum ia diperlukan. Pendekatan ini memerlukan penyelidikan dan cerapan yang menyeluruh untuk mencipta produk data yang paling berguna kepada set pengguna yang lebih besar, memacu nilai yang lebih besar bagi setiap output.
Produk data juga boleh diguna semula, jadi mereka kekal relevan memikirkan kitaran hayat mereka, kitaran hayat ini termasuk penyelenggaraan dan penambahbaikan berterusan. Memandangkan produk data menjalani kehidupannya sendiri, maklum balas boleh digabungkan dengan mudah ke dalam versi baharu.
Cabaran terbesar dalam melaksanakan dan membina produk data yang berkesan dan elegan ialah mewujudkan minda yang betul. Apabila anda beralih kepada produk data lwn. kejayaan strategi projek data diukur dengan hasil bukan output. Walaupun produk data berkembang, perancangan dan reka bentuk yang berkesan akan membantu menetapkan asas untuk produk data yang elegan.
Produk data yang berkesan dan berkuasa biasanya menunjukkan ciri-ciri tertentu. Pereka bentuk harus mengingati ciri ini semasa membuat produk data:
Untuk produk data memberi kesan, produk tersebut perlu ditemui. Malah produk yang hebat, tidak akan memenuhi potensinya jika tiada siapa tahu ia wujud. Pasaran produk data ialah cara terbaik untuk mendapatkan produk data di tangan pengguna. Sesetengah pasaran produk data akan menggunakan AI dan analitik ramalan untuk mencadangkan produk data kepada pengguna, sama seperti cara Netflix mencadangkan filem atau rancangan baharu kepada penonton. Keanggunan bukan selalu tentang cara anda mereka bentuk produk tetapi juga tentang cara anda membawanya ke pasaran dan menjadikannya boleh diakses oleh pengguna.
Data yang bersih dan tepat ialah atribut yang mesti ada untuk sebarang produk data. Jika penganalisis data tidak boleh mempercayai, produk data anda tidak akan dinilai oleh pembuat keputusan. Mereka bentuk dan membina produk data mesti termasuk proses yang boleh dipercayai untuk membersihkan dan menormalkan data kerana ia digabungkan dan disepadukan.
Setelah proses itu ditetapkan, anda perlu memastikan dan membuktikan kepada khalayak anda bahawa ia berfungsi. Ini melibatkan penjejakan dan perkongsian metrik kualiti data untuk mengukur kebolehubahan dan kesempurnaan, antara beberapa kualiti lain.
Menjaga keselamatan data adalah keperluan bagi mana-mana strategi IT tetapi membina keselamatan ke dalam produk data anda boleh diubah suai. Produk data yang direka bentuk dengan elegan boleh memberikan akses terperinci kepada aset data. Mereka bentuk peraturan akses yang mempertimbangkan peranan pengguna dan atribut data mengimbangi akses dan keselamatan. Kawalan capaian dan penutupan data ini juga menyediakan penggunaan jadual data yang cekap.
Satu lagi ciri penting ialah kemasukan penyulitan yang canggih memastikan data dilindungi apabila ia bergerak daripada pangkalan data untuk analisis.
Untuk memastikan kualiti berterusan, produk data yang hebat mempunyai keupayaan pemerhatian terbina dalam. Produk data hanya sama baik dengan kualiti data yang dihantar. Jika pembuat keputusan tidak mempercayai data yang dihasilkan oleh produk data, mereka kehilangan nilainya. Produk data harus direka bentuk dengan ciri pemantauan bersepadu yang mengesan anomali dan ralat. Ini mengurangkan kemungkinan data buruk memasuki analisis eksekutif atau digunakan untuk melatih model AI.
Salah satu faedah lain menggunakan pendekatan berasaskan produk ialah lebih banyak produk data digunakan lebih banyak nilai yang menyumbang kepada organisasi. Produk data adalah sangat fleksibel dan boleh digunakan untuk beberapa kes penggunaan sekali gus meningkatkan utilitinya. Akibatnya, produk data mesti direka bentuk untuk skala dan memenuhi permintaan pengguna yang semakin meningkat.
Adalah penting untuk mendapatkan input daripada pelbagai sumber agar produk data cukup berkuasa untuk menyelesaikan pelbagai masalah.
Membina pasukan yang pelbagai untuk membina produk data dan rangka kerja sokongan adalah penting. Pelbagai pihak berkepentingan memainkan peranan dalam mencipta produk data yang berjaya termasuk pengeluar produk data, pemilik domain dan pengguna.
Pengeluar produk data paling banyak melabur dalam kejayaan produk data dan oleh itu memimpin. Mereka mungkin mempunyai kemahiran kejuruteraan data atau kemahiran penganalisis data, tetapi tumpuan utama adalah untuk memahami keperluan pengguna. Mereka yang mempunyai latar belakang dalam pengurusan produk atau pemilikan produk memahami pemikiran produk.
Pemilik domain juga memainkan peranan penting dan biasanya bertanggungjawab untuk memastikan tadbir urus yang betul. Tadbir urus membantu dalam menetapkan kawalan dan dasar yang betul yang membawa kepada kejayaan atau kegagalan produk data menjadikan peranan pemilik domain penting.
Pengguna produk data juga merupakan bahagian penting dalam kitaran hayat berterusan produk data. Penglibatan dan maklum balas mereka memberikan input untuk meningkatkan kegunaan produk data. Mereka boleh menilai kepuasan mereka dengan produk data individu dan sejauh mana ia memenuhi keperluan mereka. Menjejaki gelagat pengguna produk data juga merupakan sebahagian besar daripada menggabungkan pengguna ke dalam proses tersebut.
Seperti kebolehtemuan, kebolehcapaian yang berkesan ialah ciri penting produk data berkualiti. Kebolehcapaian mudah mempertingkatkan proses mendapatkan produk data dan menggunakannya untuk analisis semudah mungkin yang membawa kepada pemahaman masa yang lebih pantas. Salah satu halangan kepada akses pantas ialah mengimport produk data ke dalam alat BI anda atau alat pembina model AI. Reka bentuk produk data yang elegan membolehkan produk data diakses dari dalam mana-mana pakej analitik pilihan.
Halangan kedua dan mungkin lebih sukar ialah mendapatkan kuasa untuk mengakses data. Menyediakan protokol yang betul untuk membolehkan akses menjadikan proses lebih selamat dan cekap. Menentukan dengan jelas siapa yang bertanggungjawab untuk mendayakan akses ialah bahagian penting dalam menentukan protokol yang elegan. Dalam rangka kerja yang lebih teragih, pengurus domain yang mengawasi pengumpulan data dalam kumpulan mereka mempunyai kuasa untuk menyediakan akses.
Langganan dan kontrak data menentukan tempoh akses dan cara data boleh dan tidak boleh digunakan. Dengan menyeragamkan perjanjian ini di hadapan, pengguna tidak perlu melalui proses setiap kali mereka mahukan akses kepada produk data, memudahkan proses.
Untuk memenuhi keperluan produk data pengguna harus disesuaikan dengan keperluan perniagaan tertentu dan pilihan pengguna.
Daripada menggunakan ciri data yang janggal, produk data yang elegan juga harus direka bentuk untuk saling beroperasi dengan produk data lain. Dengan kebolehoperasian terbina dalam reka bentuk, produk data boleh digabungkan dengan mudah untuk mencipta produk super data yang lebih kaya dan bernilai.
Apabila produk data berkembang, beberapa perubahan akan menjadi penambahbaikan, tetapi bukan semua. Menukar produk data juga boleh mendedahkan kelemahan, seperti risiko keselamatan dan pematuhan. Untuk memastikan produk data adalah berkualiti tinggi, produk tersebut mesti menyertakan ujian audit dan data versi. Mengenal pasti ralat dengan pantas dan menentukan sumber akan membantu memastikan produk data anda berjalan dengan selamat dan cekap.
Untuk menjadi komprehensif dan konsisten, produk data seharusnya dapat menyelesaikan masalah pengguna dengan berkesan setiap masa. Untuk mencapai matlamat ini, mereka harus direka bentuk seperti produk lain yang memastikan pengguna akhir berada di tengah-tengah proses. Sama ada pengguna ialah jurutera data, penganalisis data, penganalisis perniagaan, eksekutif perniagaan, pelanggan atau rakan kongsi, mempunyai pemahaman yang menyeluruh tentang keperluan mereka adalah kunci kejayaan.
Produk data yang komprehensif menggabungkan sumber data yang luas untuk memastikan keluasan dan liputan kes penggunaan yang konsisten. Memperkaya data dengan sumber rakan kongsi atau pihak ketiga boleh menambah kedalaman tambahan pada produk data. Contohnya, menggunakan pangkalan data kod zip untuk mengisi data alamat yang hilang dan menyeragamkannya boleh menjadikan produk data lebih komprehensif dan konsisten.
Pengguna mesti dapat memahami dengan jelas perkara yang diwakili oleh data dalam produk data anda untuk digunakan pada kes penggunaan mereka. Ini boleh menjadi satu cabaran kerana data berasal dari seluruh organisasi. Pengurusan metadata yang betul adalah penting dalam mencipta produk data yang berkuasa dan memastikan konteks dipelihara. Memastikan pengguna memahami istilah yang digunakan untuk menerangkan data dalam produk data juga penting. Menggabungkan glosari perniagaan ialah satu cara untuk membantu menyeragamkan istilah.
Salah satu pembeza utama antara produk data dan projek data ialah prestasi produk data dan keupayaannya untuk sentiasa diperbaiki dan dipertingkatkan. Walaupun kami melakukan yang terbaik untuk mereka bentuk produk data untuk memenuhi keperluan khalayak kami, ia tidak akan sentiasa mencapai sasaran atau hanya memerlukan perubahan. Membina mekanisme untuk menangkap maklum balas daripada pengguna adalah penting untuk terus menyampaikan produk data yang hebat.
Penjejakan produk data dan memahami cara ia bergema dengan pengguna adalah penting untuk menghubungkan produk dengan pengguna. Pasaran produk data yang dipenuhi dengan produk data yang sudah tua dan tidak relevan tidak sesuai dengan proses yang elegan. Produk data harus diarkibkan dan ditamatkan apabila produk tersebut mencapai penghujung kitaran hayatnya, mengurangkan hingar. Pastikan anda memilih pasaran produk data anda untuk mengoptimumkan pengalaman pengguna.
Produk data yang elegan tidak berlaku dengan sendirinya, ia memerlukan proses yang betul untuk menyokong penciptaan mereka. Tanpa itu, terdapat kecenderungan untuk menambah lebih banyak data yang menambah kerumitan. Proses memastikan data ditambah dengan sengaja. Reka bentuk yang elegan dihasilkan melalui proses berulang dan kolaboratif.
Proses reka bentuk berulang menyokong reka bentuk yang elegan kerana setiap langkah atau kitaran membawa anda lebih dekat kepada penyelesaian yang lebih ringkas dan berkuasa. Versi pertama produk data mungkin bukan penyelesaian yang optimum, jadi mereka perlu berkembang. Ciri yang tidak digunakan atau mengganggu laluan ke hasil terbaik boleh dihapuskan melalui lelaran. Pengguna baharu boleh mencari aplikasi inovatif untuk produk data yang menghasilkan ciri baharu atau pemisahan daripada produk data asal kepada sesuatu yang baharu dan lebih berkesan. Proses anda harus menerima dan menginstitusikan maklum balas untuk lebih memahami cara produk data anda memenuhi objektifnya. Apabila produk data berkembang, dan maklum balas dikumpul, idea muncul untuk produk data baharu.
Membina produk data yang hebat bukanlah sesuatu yang kecil. Menciptanya dari awal tanpa asas teknologi yang kukuh boleh menjadi lebih sukar. Platform produk data boleh menjadikan proses lebih mudah. Extrica ialah platform analisis data moden yang direka dari bawah ke atas untuk menyelaraskan penciptaan produk data. Untuk mengetahui lebih lanjut tentang keupayaan Extrica dan cara platform boleh membantu anda mencipta produk data yang elegan jadualkan demo .