การจัดการข้อมูลเมตา ในยุคใหม่ที่เราบริการตนเอง

การจัดการข้อมูลเมตา ในขณะที่โลกของการจัดการข้อมูล เติบโตและเปลี่ยนแปลงไป บทบาทและผู้เข้าร่วมในระบบนิเวศ ข้อมูลจึงต้องปรับตัว ด้วยการบรรจบกันของอิทธิพล หลายอย่าง เช่น ข้อมูลขนาดใหญ่ การวิเคราะห์แบบ บริการตนเอง เครื่องมือเตรียมข้อมูล แบบบริการตนเอง แนวทาง ปฏิบัติด้านวิทยาศาสตร์ข้อมูล ฯลฯ เรากำลังก้าวเข้าสู่ยุค ของผู้ดูแลข้อมูลและผู้เลือกซื้อ ข้อมูลอย่างรวดเร็ว นักช้อปข้อมูลอธิบายถึงใครก็ตาม ที่กำลังมองหาข้อมูลเพื่อตอบสนองความต้องการ ด้านข้อมูลหรือการวิเคราะห์ ผู้ดูแลข้อมูลคือบทบาทที่รับผิดชอบในการดูแล คอลเลกชันของสินทรัพย์ข้อมูล และ ทำให้ผู้ซื้อข้อมูลพร้อมใช้งานและค้นหาได้

คำว่า “curated” ใช้บ่อยในปัจจุบัน การใช้คำแบบดั้งเดิมนั้นเกี่ยวข้อง กับคอลเล็กชันของสิ่งประดิษฐ์ ในพิพิธภัณฑ์และงานศิลปะในแกลเลอรี่ เมื่อไม่นานมานี้ เราเริ่มใช้คำนี้ เพื่ออธิบายคอลเล็กชันที่ มีการจัดการหลายประเภท เช่น เนื้อหาที่คัดสรรที่เว็บไซต์และคอลเล็กชัน เพลงที่คัดสรรจากบริการสตรีม

Curated data คือชุดของชุดข้อมูล ที่ เลือกและจัดการเพื่อตอบสนองความต้องการ และความสนใจของกลุ่มคน ที่เฉพาะเจาะจง ทุกองค์กรมีกลุ่มคนที่มีความสนใจในการรวบรวมข้อมูล โปรดทราบว่าจุดเน้นในที่นี้คือชุดข้อมูลเช่น ไฟล์ ตาราง ฯลฯ ที่สามารถเข้าถึงและวิเคราะห์ได้ ความแตกต่างระหว่าง “ชุดข้อมูล” และ “ชุดชุดข้อมูล” นั้นละเอียดอ่อนแต่มีนัยสำคัญ

มีองค์ประกอบสำคัญสองส่วนในการ ทำให้ข้อมูลที่รวบรวมไว้เป็นจริงได้ นั่นคือ การรวบรวมข้อมูล และ การจัดทำรายการข้อมูล Curated data นำเสนอบทบาทใหม่ในการจัดการข้อมูล – Data Curator การจัดการข้อมูลทำให้เกิด ความต้องการเครื่องมือใหม่ – แคตตาล็อกข้อมูล

การจัดการข้อมูล – อะไร ทำไม และใคร

ในอดีตที่ไม่ไกลเกินไป ข้อมูลเกือบทั้งหมด ที่ใช้โดยธุรกิจถูกสร้างขึ้นภายในองค์กร ข้อมูลธุรกรรมจากระบบ OLTP จะถูกแปลงเป็นคลังข้อมูลในเวลาต่อมา การนำข้อมูลขนาดใหญ่มาใช้เปลี่ยนแปลง ความเป็นจริงนั้นด้วยส่วนแบ่งข้อมูล ที่เพิ่มขึ้นซึ่งมาจากแหล่งภายนอก และอย่างน้อย ก็ในความหมายที่ไม่เป็นทางการ กลายเป็นข้อมูล ที่ได้รับการดูแลจัดการ สิ่งสำคัญคือ ต้องตระหนักว่าข้อมูลที่ได้รับการดูแล จัดการบางส่วนไม่ได้ถูกสร้างขึ้น จากภายนอก กระบวนการภายในยังสร้างชุดข้อมูล ที่ได้รับการดูแล แนวโน้มสู่การจัดการข้อมูลจะเร่งตัวขึ้น เมื่อสัดส่วนของข้อมูลภายนอกเพิ่มขึ้น และ ชุดข้อมูลที่ผสมผสานข้อมูลภายใน และภายนอก (data lake, data sandbox ฯลฯ) ได้รับความสนใจและน่าสนใจ กระบวนการวิเคราะห์อาจสร้าง ชุดข้อมูลใหม่ที่อยู่ภายใต้การดูแลจัดการ

เพื่อให้ทันกับแนวโน้มของข้อมูลที่เร่งตัวขึ้น เราจำเป็นต้องเปลี่ยนจาก การดูแลจัดการอย่างไม่เป็นทางการ ไปสู่การจัดการข้อมูลที่วางแผน จัดระเบียบ และจัดการ Data Curator จะต้องได้รับการยอมรับว่าเป็นบทบาท การจัดการข้อมูลที่สำคัญและมีหน้าที่รับผิดชอบในการ:

  • ประเมินคุณภาพ ความถูกต้อง และประโยชน์ของชุดข้อมูล
  • เลือกชุดข้อมูลที่ประกอบเป็นคอลเลกชันข้อมูลที่รวบรวมไว้
  • อธิบายชุดข้อมูลให้เพียงพอ ต่อเนื้อหาและประโยชน์
  • ใส่คำอธิบายชุดข้อมูลด้วยข้อมูลเพิ่มเติมที่มีค่า
  • จัดหมวดหมู่ชุดข้อมูล จัดเตรียมบริบทและทำให้ค้นหาได้ง่าย
  • แค็ตตาล็อกชุดข้อมูลที่มีข้อมูลเมตาเพื่อค้นหา ค้นหา ทำความเข้าใจ เข้าถึง และใช้งาน
  • รับฟังความคิดเห็นของผู้ใช้และนำไปใช้เพื่อแจ้งข้อมูลแก่ผู้ใช้ในอนาคตได้ดียิ่งขึ้น
  • เก็บถาวรชุดข้อมูลที่เข้าถึงได้ยากแต่ไม่ควรลบอย่างถาวร
  • รักษาคุณภาพชุดข้อมูลและความสามารถในการเข้าถึงได้ตลอดอายุการใช้งาน

บทบาทของ Data Steward และ Data Curator มีความเกี่ยวข้องกันและค่อนข้างทับซ้อนกัน สจ๊วตและภัณฑารักษ์ทำงานร่วมกันเพื่อเพิ่มมูลค่าของทรัพยากรข้อมูลให้สูงสุด สจ๊วตและภัณฑารักษ์มีจุดมุ่งหมาย ที่แตกต่างกัน ผู้แนะนำรวบรวมและจัดการชุดข้อมูล (ตาราง ไฟล์ ฯลฯ) สจ๊วตมุ่งเน้นที่ระดับนามธรรมเกี่ยวกับแนวคิดข้อมูล (หัวเรื่อง เอนทิตี ความสัมพันธ์) และที่ระดับการนำไปใช้กับองค์ประกอบข้อมูล ตารางนี้เปรียบเทียบความแตกต่างในจุดสนใจของสจ๊วตและภัณฑารักษ์

การทำงานร่วมกันของการกำกับดูแลข้อมูล และการจัดการข้อมูลเป็นสิ่งสำคัญ การจัดการข้อมูลไม่ได้แทนที่การกำกับดูแลข้อมูล แต่ขยายและเสริมให้สมบูรณ์ ตารางนี้เปรียบเทียบ และเปรียบเทียบมุมมอง ด้านการกำกับดูแลและการดูแลจัดการ

การทำรายการข้อมูล – อะไร ทำไม และอย่างไร

การทำรายการข้อมูล เป็นกิจกรรมการจัดการข้อมูล ที่เกี่ยวข้องกับการรวบรวม ตรวจสอบ และเผยแพร่ข้อมูลเมตา เกี่ยวกับชุดข้อมูลที่พร้อมใช้งานสำหรับชุมชนของผู้ใช้ การวิเคราะห์ข้อมูล แมชชีนเลิร์นนิง และความรู้จากฝูงชนอาจรวมเข้าด้วยกันเพื่อรวบรวมข้อมูลเมตาที่ครอบคลุม แคตตาล็อกข้อมูลคือคอลเล็กชันของข้อมูลเมตา รวมกับการจัดการข้อมูล และเครื่องมือค้นหา ซึ่งช่วยให้นักวิเคราะห์และผู้ใช้ข้อมูลรายอื่นสามารถค้นหา ข้อมูลที่ต้องการได้ แคตตาล็อกข้อมูลทำหน้าที่เป็นรายการ ข้อมูลที่มีอยู่และให้ข้อมูลเพื่อประเมินความเหมาะสม สำหรับการใช้งานตามวัตถุประสงค์ Data Catalog ครอบคลุมงานทั้งหมดที่ดำเนินการเพื่อสร้างและบำรุงรักษาแค็ตตาล็อกข้อมูล

ทุกคนเคยทำงานกับพจนานุกรม ข้อมูลและที่เก็บข้อมูลเมทาดาทา คุณอาจสงสัยว่าแค็ตตาล็อก ข้อมูลแตกต่างจากพจนานุกรมและข้อมูลเมตาอย่างไร แคตตาล็อกข้อมูลเป็นที่เก็บเมทาดาทา แต่เป็นที่เก็บประเภทอื่น ที่ออกแบบมาเพื่ออำนวยความสะดวกให้ผู้คนค้นหา และเลือกชุดข้อมูลที่ตรงกับความต้องการ เฉพาะของพวกเขา ตารางนี้เปรียบเทียบคุณลักษณะ และฟังก์ชันของพจนานุกรม ที่เก็บข้อมูลเมตา และแค็ตตาล็อกข้อมูล

สิ่งสำคัญคือต้องตระหนักถึงความแตกต่าง ของการวางแนวและการโฟกัส ระหว่างพจนานุกรมข้อมูล ที่เก็บข้อมูลเมตา และแค็ตตาล็อกข้อมูล แต่ละคนมีบทบาทและจุดประสงค์ ล้วนแต่มีความสำคัญแตกต่างกันไป ในขอบเขตและทำสิ่งต่างๆ พจนานุกรมมักจะเน้นการใช้งาน ที่เก็บข้อมูลเมตามักเป็นเครื่องมือ เฉพาะและเป็นกรรมสิทธิ์ แค็ตตาล็อกข้อมูล เป็นแหล่งข้อมูลเดียวที่บูรณาการเกี่ยวกับชุดข้อมูลที่รวบรวมไว้ การโต้ตอบ และความสามารถในการค้นหาขั้นสูง ช่วยสานแคตตาล็อกข้อมูลให้เป็นส่วนหนึ่ง ของกระบวนการวิเคราะห์

เครื่องมือจัดทำรายการข้อมูล มีให้ใช้งานอย่างรวดเร็ว และเติบโตเต็มที่ โดยไม่ได้ตั้งใจที่จะรับรองเครื่องมือใดๆ หรือเพื่อให้รายการที่ละเอียดถี่ถ้วน ฉันจะบอกชื่อบางส่วนสำหรับ ผู้ที่สนใจสำรวจเครื่องมือต่างๆ Alation, Attivio, Microsoft Azure, Tamr, Waterline Data และ Zaloni Mica เป็นตัวแทนภาคตัดขวาง ของตลาดซอฟต์แวร์แคตตาล็อกข้อมูล

ตลาดข้อมูล – วิสัยทัศน์แห่งอนาคต

เราทำงานในยุคของ การวิเคราะห์แบบบริการตนเอง องค์กรด้านไอทีไม่สามารถ (และอาจไม่ควร) ให้ข้อมูลทั้งหมดที่จำเป็นสำหรับผู้คนจำนวนมากขึ้นที่วิเคราะห์ข้อมูล แต่ปัจจุบันนี้ธุรกิจ และนักวิเคราะห์ข้อมูลมักจะทำงานอย่างมืดบอด พวกเขาไม่สามารถมองเห็นชุดข้อมูลที่มีอยู่ เนื้อหาของชุดข้อมูลเหล่านั้น ตลอดจนคุณภาพและประโยชน์ ของชุดข้อมูลแต่ละชุด ส่งผลให้พวกเขาใช้เวลามากเกินไปในการค้นหาข้อมูล ทำความเข้าใจข้อมูล และ สร้างชุดข้อมูลที่มีอยู่แล้วขึ้นใหม่ ในสถานการณ์ที่เลวร้ายที่สุด พวกเขาทำงานกับชุดข้อมูลที่ไม่เพียงพอและไม่เข้าใจ ส่งผลให้การวิเคราะห์ไม่เพียงพอและไม่ถูกต้อง การจัดการข้อมูลเมตา

แหล่งข้อมูลหลายแห่งกล่าวว่าธุรกิจทั่วไป หรือนักวิเคราะห์ข้อมูลใช้เวลาประมาณ 80% ในการค้นหาและแก้ไขข้อมูล โดยใช้เวลาเพียง 20% ในการวิเคราะห์ข้อมูล และค้นหาความหมายทางธุรกิจ แคตตาล็อก และการจัดการเป็นกุญแจสำคัญในการย้อนกลับตัวเลขเหล่านี้

ลองนึกภาพตลาดข้อมูล – Amazon สำหรับนักช้อปข้อมูล – ด้วยความสามารถในการค้นหาด้วยภาษาธรรมชาติ คำอธิบายของชุดข้อมูล คำอธิบายประกอบของ Data Curator การให้คะแนน และบทวิจารณ์โดยผู้อื่นที่เคยใช้ชุดข้อมูล และโอกาสในการโพสต์การให้คะแนนและบทวิจารณ์ของคุณเอง การจัดหมวดหมู่ การทำรายการ และตลาดคืออนาคตที่นักวิเคราะห์ธุรกิจและข้อมูลสามารถทำงานด้วยสายตาที่เปิดกว้าง

THAI-PDPA เปิดให้คำปรึกษาโดยผู้เชี่ยวชาญแบบครบวงจร ด้วยเทคโนโลยี Data Protection Services ที่แนะนำให้ไปประยุกต์ใช้เพื่อปกป้องข้อมูลพนักงานและลูกค้า

ผู้ที่สนใจใช้บริการ Data Protection Services ของ THAI-PDPA สามารถติดต่อฝ่ายขายที่ดูแลคุณหรือฝ่ายการตลาดได้ที่เบอร์ 0-2860-6659 หรืออีเมล dcs@ko.in.th สอบถามได้สบายใจทั้ง เรื่องค่าบริการ ราคา และ งบประมาณ เพราะเป็นราคาที่สุดคุ้มที่สุด

หากท่านมีความสนใจ บทความ หรือ Technology
สามารถติดต่อได้ตามเบอร์ที่ให้ไว้ด้านล่างนี้
Tel.086-594-5494
Tel.095-919-6699

สนใจรับคำปรึกษาด้านวางระบบจัดการเอกสารอิเล็กทรอนิกส์  EDMS โดยทีมงานผู้เชี่ยวชาญจาก K&O ที่มีประสบการณ์มากว่า 15 ปี รวมถึงซอฟต์แวร์ระดับโลก ติดต่อ 0 2 – 8 6 0 – 6 6 5 9

หรือ E m a i l : c s @ k o . i n . t h สอบถามได้สบายใจทั้ง เรื่องค่าบริการ ราคา และ งบประมาณ เพราะเป็นราคาที่สุด คุ้มที่สุด

Leave A Comment?