Cara membina kepercayaan dengan produk data


Untuk organisasi beroperasi dengan cekap, pembuat keputusan harus dapat membuat keputusan yang didorong oleh data yang baik. Adil untuk mengatakan bahawa kepercayaan terhadap data adalah yang terpenting dalam organisasi dipacu data hari ini Memandangkan aplikasi AI menjadi arus perdana, kualiti data menjadi lebih kritikal. Jika kita tersilap melatih model AI dengan data yang buruk, hasil yang buruk pasti akan terhasil. Jika model AI yang berinteraksi dengan pelanggan berprestasi buruk, ia boleh memberi kesan yang besar pada perniagaan dan ekuiti jenama jangka panjang. Anda mesti boleh mempercayai data anda sekuat mana anda mempercayai pekerja anda.

Walaupun kepercayaan terhadap data adalah penting, secara mengejutkan ia adalah rendah. Pada tahun 2020, KPMG mendapati bahawa hanya 35% pembuat keputusan mempercayai data perusahaan mereka. Satu lagi kajian pada 2023 oleh Precisely and the LeBow School of Business menunjukkan beberapa peningkatan; namun hanya 46% responden mempunyai kepercayaan yang tinggi atau sangat tinggi terhadap data mereka.

Organisasi membuat beberapa kesilapan yang membawa kepada kualiti data yang lemah dan pecah amanah:

  • Menerbitkan data lapuk
  • Menerbitkan data yang tidak tepat
  • Menerbitkan data yang tidak lengkap
  • Tidak menyediakan konteks untuk memastikan data difahami dengan baik

Kesilapan ini membawa kepada keputusan yang tidak baik dan prestasi perniagaan yang lemah. Sebagai contoh, jika pekerja membuat komitmen kepada pelanggan berdasarkan data yang cacat dan tidak dapat memenuhi janji itu, syarikat berisiko kehilangan bukan sahaja pelanggan tetapi juga reputasinya.

Kehilangan kepercayaan itu mudah tetapi, apabila hilang, untuk mendapatkannya kembali adalah sangat sukar. Sebaik sahaja eksekutif menggunakan data yang tidak baik atau menyemak laporan dengan ralat, keyakinan mereka terhadap data akan datang goyah.

Mengapa Produk Data Lebih Dipercayai daripada Talian Paip Data

Meningkatkan kepercayaan data memerlukan perubahan asas dalam cara kami mengakses dan menggunakan data. Proses tradisional mengakses data telah didayakan dengan melancarkan projek individu dan membina saluran paip ETL. Kejayaan projek ini diukur berdasarkan jumlah kod yang dibangunkan dan jumlah data yang dihantar. Kualiti data, walaupun penting, hanyalah sebahagian daripada persamaan. Dalam pemikiran berasaskan projek, kuantiti keluaran adalah ukuran kejayaan.

Walau bagaimanapun, apabila kami mengalihkan objektif kepada hasil perniagaan, kualiti data menjadi ukuran teras kejayaan. Kepercayaan dibina apabila matlamat dan motivasi pengamal data sejajar dengan matlamat pengguna data. Produk data yang berjaya tidak diukur dengan jumlah data yang disediakan tetapi oleh sejauh mana ia memenuhi keperluan penggunanya. Genesis mana-mana produk data datang daripada hasil perniagaan yang diingini. Walaupun produk data menyediakan akses kepada sejumlah besar data dengan sangat cepat, produk tersebut tidak akan digunakan, jika mereka tidak memenuhi keperluan pengguna sekali gus mengehadkan keupayaan mereka untuk menyampaikan hasil perniagaan yang positif. Untuk produk data berjaya, pengguna mesti cukup mempercayainya untuk mendasarkan keputusan mereka pada outputnya.

Keterlihatan dan Kerjasama Lebih Besar Mengurangkan Ralat dan Membina Kepercayaan

Kejayaan produk data didorong oleh pasukan yang pelbagai dengan fungsi berbeza yang bekerjasama untuk menyampaikan hasil perniagaan yang unggul. Proses ini perlu dibina atas kepercayaan, ketelusan, keterlihatan dan kerjasama dalam kalangan rakan sekerja. Kepercayaan di kalangan pasukan produk data diterjemahkan kepada data yang boleh dipercayai oleh pengguna.

Dengan proses ETL berasaskan projek, kerjasama, keterlihatan dan ketelusan adalah satu cabaran. Lazimnya, projek ini berasal dari permintaan data daripada pengguna, namun sebaik sahaja saluran paip dibina dan data dihantar, pengguna mungkin tidak mempunyai apa-apa keterlihatan tentang cara atau bila data dikumpulkan.

Begitu juga, jurutera data tidak selalu tahu cara data yang mereka hantar digunakan di hiliran. Mereka mungkin tidak menyedari bagaimana tindakan mereka akan mempengaruhi analisis hiliran model AI. Contohnya, jika jurutera data menukar skema set data, ia boleh memecahkan beberapa analisis atau papan pemuka yang bergantung pada set data tersebut.

Selain itu, terdapat kekurangan proses untuk memberikan maklum balas. Memandangkan proses ini berkod keras, sukar untuk menukar dan menggabungkan maklum balas, walaupun terdapat lebih banyak keterlihatan dalam penggunaannya.

Membina Kepercayaan dengan Produk Data

Strategi produk data yang berjaya dibina pada tindanan data atau platform standard yang membolehkan kerjasama, keterlihatan dan ketelusan yang lebih baik.

Kerjasama

Komunikasi dan kerjasama yang dipertingkatkan sentiasa membina lebih kepercayaan dan oleh itu harus menjadi aspek penting dalam strategi produk data.

Bekerjasama di sekitar akses data dan berkongsi tanggungjawab untuk melindungi data mewujudkan persefahaman bersama di kalangan pasukan data. Strategi tadbir urus bersekutu, di mana pasukan IT pusat dan pengurus domain berkongsi tanggungjawab untuk tadbir urus data, ialah ciri teras strategi data yang dibina pada produk. Manfaat pendekatan ini ialah orang yang paling biasa dengan data, pengurus domain, lebih terlibat dalam tadbir urus data. Ini menyokong pendekatan yang lebih bernuansa dan praktikal terhadap tadbir urus data. Berkongsi tanggungjawab tadbir urus data membolehkan skalabiliti dan ketangkasan yang lebih besar, kerana tidak setiap dasar tadbir urus perlu dijalankan melalui jabatan IT.

Untuk strategi ini berfungsi, domain dan pihak berkuasa IT mesti bekerjasama dan mempercayai antara satu sama lain. Domain yang berbeza dan jabatan IT perlu bekerjasama untuk menentukan siapa yang bertanggungjawab ke atas tadbir urus set data mana, di mana kawalan IT berakhir dan di mana domain bermula. Pemahaman dan komunikasi yang jelas mengelakkan kekeliruan. Ini menghasilkan produk data yang fleksibel dan boleh disesuaikan dengan kualiti data tinggi yang boleh dipercayai oleh pengguna.

Pengeluar data dan pengguna juga boleh membina kepercayaan melalui kerjasama. Daripada pendekatan berasaskan projek di mana data dilemparkan ke atas "pagar" peribahasa, produk data sentiasa berkembang. Pencipta produk data boleh sentiasa menggabungkan maklum balas daripada pengguna. Pertukaran maklum balas ini membina kepercayaan antara pencipta dan pengguna, memastikan pencipta mempunyai hasil perniagaan pengguna di tengah-tengah proses pembangunan.

Pengguna juga bekerjasama dengan pengguna lain untuk membina kesahan. Biasanya, pasaran produk data akan membenarkan pengguna menilai produk data untuk memberikan pengesahan kepada kualiti dan kegunaan produk data.

Menyediakan platform untuk menyelaraskan peserta dan membolehkan kerjasama dan maklum balas sepanjang proses menyokong keyakinan yang lebih besar di kalangan pasukan dan kepercayaan pengguna terhadap output mereka.

Keterlihatan dan Ketelusan

Keterlihatan dan ketelusan adalah penting untuk menyampaikan produk data yang boleh dipercayai. Kekurangan keterlihatan membawa kepada ralat biasanya dalam pendekatan jenis air terjun linear yang sering digunakan untuk membangunkan saluran paip ETL, memberikan keterlihatan yang sangat sedikit antara pengguna data dan jurutera yang membangunkan proses tersebut. Jika ralat dalam proses transformasi berlaku, pengguna data mungkin tidak tahu terdapat isu dan akan terus menggunakan data lapuk atau salah dalam analisis mereka. Sebaliknya, jurutera data biasanya tidak mempunyai keterlihatan tentang cara perubahan yang mereka sertakan dalam bahagian belakang mempengaruhi model penganalisis.

Produk data, persekutuan data dan pengurusan metadata berpusat bertindak sebagai jambatan antara jurutera data dan pengguna data. Pengurus dan pengeluar produk data memudahkan pemahaman yang lebih baik tentang keperluan, keperluan dan kebimbangan antara jurutera data dan pengguna data.

Platform pengeluaran produk data bertindak sebagai tempat pusat untuk kerjasama, mendapatkan maklumat tentang kesihatan produk data dan aplikasinya untuk menggunakan kes atau pelbagai model. Kunci kepada ketelusan ini ialah platform tadbir urus bersekutu yang menjejak dan mengurus dasar tadbir urus merentas domain. Semua peserta boleh memberikan input dan mengumpulkan data tentang produk data dan data yang membentuknya, seperti:

  • Kesempurnaan: kiraan bilangan rekod dengan nilai data tidak lengkap atau batal.
  • Kesahan: jika data mencerminkan realiti atau perkara yang anda harapkan untuk dilihat.
  • Ketepatan masa: sejauh mana data terkini.
  • Keturunan: sumber data dan kebolehpercayaannya.
  • Ketepatan: ukuran ketepatan data.
  • Keunikan: kekerapan pengulangan sesuatu nilai.

Pesawat kawalan metadata adalah teras platform ini memberikan ketelusan ke dalam metadata seluruh perusahaan. Platform data bersekutu menggabungkan data dari seluruh organisasi untuk memberikan keterlihatan yang lebih besar kepada kualiti data dan keturunan. Repositori pusat ini juga menjejaki perubahan metadata pada sumber untuk memastikan penganalisis data boleh menyesuaikan model mereka dan menganalisis dengan sewajarnya. Makluman automatik dihantar kepada pengguna yang melanggan memberitahu mereka tentang perubahan dan kesihatan data dengan sistem penjejakan berpusat ini.

Konteks

Data berkualiti tinggi adalah asas untuk mewujudkan kepercayaan terhadap data, dan begitu juga menyediakan konteks yang betul di sekitar data ini. Istilah perniagaan tidak selalu seragam merentas domain. Jika pengguna data keliru tentang maksud istilah atau cara KPI dikira, ralat akan berlaku dan pengguna akan kehilangan kepercayaan. Glosari data sangat membantu dalam memastikan pengguna memahami maksud data yang mereka gunakan untuk mengelakkan kekeliruan dan kesilapan.

Kebolehtemuan

Keupayaan untuk mencari set data yang betul untuk projek analitik juga membantu membina kepercayaan dalam aset data anda. Menilai metrik kesihatan dan kualiti merentas semua set data daripada satu anak tetingkap kaca membolehkan penganalisis mempertimbangkan berbilang pembolehubah sebelum menambah set data pada analisis mereka. Selain itu, pasaran produk data yang memanfaatkan AI boleh mengesyorkan produk data terbaik untuk pengguna. Keupayaan ini membina kepercayaan bahawa platform ini direka bentuk untuk menyampaikan bukan sahaja data yang lebih baik, tetapi hasil perniagaan yang lebih baik.

Dalam era data dan AI, kami akan semakin bergantung pada data yang kami kumpulkan dan berdasarkan keputusan kami. Keupayaan untuk mempercayai kualiti data ini akan mempunyai kesan yang mendalam terhadap hasil perniagaan. Mereka yang berjaya akan menjadikan kualiti dan integriti data sebagai keutamaan.

Untuk mengetahui tentang membina produk data yang boleh dipercayai dengan platform Avrio jadualkan demo.

Discover the Latest in Data and AI Innovation

  • Blog

    AWS re:Invent rekap

    Read More

  • Blog

    AI Generatif dalam analisis data - bagaimana AI memudahkan untuk mengakses data

    Read More

  • E-book

    Data tidak berstruktur dengan tindanan data moden

    Read More

Request a Demo TODAY!

Take the leap from data to AI