2 ปี BDI ปักธง Big Data-AI พลิกอนาคตดิจิทัลไทย

2 ปี BDI ปักธง Big Data-AI พลิกอนาคตดิจิทัลไทย

สถาบันข้อมูลขนาดใหญ่ (องค์การมหาชน) หรือ BDI เผยทิศทางอนาคตการใช้ Big Data และ AI พัฒนาเศรษฐกิจสังคมประเทศ ในงาน “BDI Day 2025: Next Move for Big Data and AI ก้าวต่อไปของ Big Data และ AI เพื่อเศรษฐกิจและสังคม” ซึ่งจัดขึ้นในวาระครบรอบ 2 ปีการดำเนินงาน พร้อมนำเสนอผลงานการขับเคลื่อนไทยสู่ยุคดิจิทัล

รองศาสตราจารย์ ดร.ธีรณี อจลากุล ผู้อำนวยการ BDI กล่าวถึง “ภาพจิ๊กซอว์” ซึ่งเป็นแผนยุทธศาสตร์ชาติที่ BDI มุ่งมั่นผลักดัน โดยมีเป้าหมายหลักคือการทำให้ประเทศสามารถใช้ข้อมูลในการทำงาน วิเคราะห์ วางนโยบาย เพิ่มประสิทธิภาพการดำเนินงาน และยกระดับการให้บริการประชาชน แผนยุทธศาสตร์นี้ให้ความสำคัญกับการพัฒนาโครงสร้างพื้นฐานดิจิทัลที่แข็งแกร่งหลายด้าน

ส่วนแรกคือ Government Cloud Provisioning ซึ่งผู้อำนวยการ BDI ระบุว่าการใช้ “Cloud First” จะช่วยปลดล็อกอุปสรรคหลายประการ ทำให้กระบวนการจัดซื้อจัดจ้างสั้นลง และสามารถปรับเปลี่ยนเทคโนโลยีได้รวดเร็วยิ่งขึ้น ส่วนต่อมาคือ Government Data Catalog ซึ่งมีความจำเป็นอย่างยิ่ง เนื่องจากในปัจจุบันยังขาดการมองเห็นภาพรวมว่าหน่วยงานใดถือครองข้อมูลใดบ้าง ดังนั้น แนวคิดของ Data Catalog คือการให้ทุกหน่วยงานภาครัฐสามารถระบุรายการข้อมูลที่เป็นโครงสร้างพื้นฐานสารสนเทศสำคัญของตนเองได้ เพื่อให้เมื่อมีการค้นหาและพบเจอ จะสามารถเชื่อมโยงเรื่องราวต่าง ๆ ได้อย่างถูกต้อง

ส่วนสำคัญที่สุดคือ National Big Data Platform (D2 – Data Integration and Intelligence) แพลตฟอร์มกลางของ BDI ซึ่ง รศ.ดร.ธีรณี ชี้ว่าจะช่วยให้การเริ่มต้นโครงการใหม่ ๆ ในครั้งต่อไปจะรวดเร็วขึ้น โดยแพลตฟอร์มนี้จะเริ่มดำเนินการเต็มรูปแบบในปี 2569 และได้เริ่มบางส่วนแล้วในปี 2568 โครงสร้างพื้นฐานอื่น ๆ รวมถึง Common Microservices เช่น Digital ID, Spatial Data Services สำหรับการวิเคราะห์ข้อมูลเชิงพื้นที่ และ Cyber Standards and Tools

นอกเหนือจากโครงสร้างพื้นฐานหลักแล้ว สถาบันฯ ยังให้ความสำคัญกับเครื่องมือและมาตรฐานทางเทคโนโลยี (Tools กับ Technology Standard) เช่น Standard Technology Stack สำหรับการพัฒนาซอฟต์แวร์ภาครัฐ เพื่อให้บุคลากรไอทีสามารถหมุนเวียนข้ามหน่วยงานได้โดยไม่ต้องเรียนรู้ใหม่ทั้งหมด PDPA Compliance Tools เครื่องมืออัตโนมัติที่จะช่วยตอบคำถามเบื้องต้นเกี่ยวกับการปฏิบัติตาม PDPA, Sharing Facilitation ซึ่งเป็นแพลตฟอร์มและกลไกอำนวยความสะดวกในการแบ่งปันข้อมูล รวมถึงกฎหมายหรือระเบียบรองรับ Governance Action Plan แผนปฏิบัติการด้านธรรมาภิบาลข้อมูลที่สามารถนำไปปฏิบัติได้จริงผ่านระบบไอที TOR Guideline for Digital Procurement และ Utilization Measurement การวัดผลการใช้ประโยชน์จากระบบเพื่อเป็นข้อมูลป้อนกลับในการปรับปรุง

รศ.ดร.ธีรณีให้รายละเอียดเกี่ยวกับ National Big Data Platform (D2) หรือชื่อเล่น “D2” ว่าเป็นแพลตฟอร์มที่ออกแบบมาเพื่อเชื่อมโยงข้อมูลภาครัฐ มีทีม Data Analytic Service (DAS) ซึ่งปัจจุบันมีบุคลากรกว่า 30 คน คอยให้บริการวิเคราะห์ข้อมูล รศ. ดร.ธีรณี ย้ำว่า D2 มีแนวคิดคล้าย X-Road ของเอสโตเนีย คือข้อมูลควรอยู่ที่ต้นทาง และไม่ได้ตั้งใจจะนำข้อมูลทั้งหมดมากองรวมไว้ในคลังข้อมูลขนาดใหญ่ที่เดียว แต่เป็นการสร้าง “ถนน” เพื่อไปเชื่อมโยงทุกคน โดยเจ้าของข้อมูลยังคงเป็นผู้ควบคุมและสามารถกำหนดเงื่อนไขการใช้ข้อมูลได้ การใช้งาน D2 จะเริ่มจากการลงทะเบียนชุดข้อมูลที่มีเข้ามาในบัญชีข้อมูลของ D2 เมื่อค้นหาแล้วพบข้อมูล ก็จะมีโมดูลที่ตรวจสอบสิทธิ์การเข้าถึงตามที่เจ้าของข้อมูลกำหนด

สำหรับโครงการเด่นที่กำลังดำเนินการภายใต้การกำกับดูแลของ BDI นั้น Health Link กำลังพัฒนาบริการใหม่คือ “Health Analytic Service” ซึ่งเป็นโครงการนำร่องที่ สปสช. ให้งบประมาณแก่ IHPP โดย BDI เข้าไปมีส่วนร่วมในฐานะนักวิเคราะห์ข้อมูลตามโจทย์ของ สปสช. และโครงการ Travel Link ได้เปิดตัว “Travelist” แพลตฟอร์มสำหรับผู้ประกอบการโรงแรมในการใช้วิเคราะห์รีวิวจากแพลตฟอร์มออนไลน์ชั้นนำด้วย AI เพื่อทำความเข้าใจเสียงของลูกค้า และตัดสินใจบนพื้นฐานของข้อมูล โดยสร้างรายงานสรุปแนวโน้มความคิดเห็นรายสัปดาห์

บทบาท BDI ในแผน AI แห่งชาติ

ในส่วนของแผน AI แห่งชาติ BDI มีบทบาทสำคัญในการขับเคลื่อน 2 ส่วนหลัก ส่วนแรกคือการสร้าง National Databank ซึ่งเป็นการรวบรวมข้อมูลสำคัญเพื่อใช้ในการฝึก AI เช่น ข้อมูลภาษาไทยจากหอสมุดแห่งชาติ ข้อมูลกฎหมายทุกฉบับจากสำนักงานคณะกรรมการกฤษฎีกา และบันทึกข้อความราชการจำนวนมหาศาล รวมถึงข้อมูลภาพทางการแพทย์กว่า 2 ล้านภาพจากความร่วมมือของเนคเทคและมหาวิทยาลัยมหิดล ส่วนที่สองคือการสร้าง Open Source AI Community โดยร่วมมือกับพันธมิตรหลายภาคส่วนเพื่อกระตุ้นให้เกิด Thai LLM (Large Language Model) หรือแบบจำลองภาษาขนาดใหญ่ภาษาไทย ซึ่ง รศ.ดร.ธีรณี อธิบายว่าไม่ใช่การสร้างโมเดลใหม่ทั้งหมด แต่เป็นการนำโมเดลโอเพนซอร์สที่มีอยู่แล้วมาฝึกสอนต่อด้วยข้อมูลชุดใหม่ โดยความสามารถของโมเดลจะขึ้นอยู่กับจำนวนและความหลากหลายของข้อมูล และคาดว่าจะเปิดตัว Foundation Model พื้นฐานที่สามารถสนทนาภาษาไทยได้ภายในเดือนสิงหาคม-กันยายนนี้

นอกจากนี้ BDI ยังให้ความสำคัญกับการพัฒนาบุคลากรผ่านโครงการ Micro-credentials โดยรศ.ดร.ธีรณี กล่าวว่าหลักสูตรสำหรับนักเรียนมัธยม (ม.5-ม.6) นั้นมีความยาวหลายสิบชั่วโมง และได้มีการเทียบเคียงกับผลลัพธ์การเรียนรู้ของโรงเรียน เพื่อให้สามารถนับหน่วยกิตเป็นวิชาในหลักสูตรได้ โดยได้นำร่องกับโรงเรียนแห่งหนึ่งซึ่งจัดการเรียนการสอนในห้องคอมพิวเตอร์ร่วมกันโดยมีครูยืนหน้าชั้นคอยดูแล และได้เปิดคอร์สออนไลน์สั้น ๆ ชื่อ “Prompting with AI” ซึ่งมีผู้สนใจลงทะเบียนเรียนกว่า 7,000 คน

สถาบันฯ ยังได้นำเทคโนโลยีดิจิทัลมาใช้ในการบริหารจัดการภายในอย่างเต็มรูปแบบ โดยไม่ได้ใช้ระบบตอกบัตร แต่ใช้ระบบลง Story Point เพื่อติดตามผลลัพธ์ของงาน และมีแดชบอร์ดแสดงข้อมูลการดำเนินงานแบบเรียลไทม์ ซึ่งคณะกรรมการบริหารสามารถเข้าถึงเพื่อติดตามการทำงานของสถาบันได้อย่างแท้จริง

ข้อมูลสิ่งแวดล้อม ตัวอย่างการประยุกต์ EnviLink

วีระศักดิ์ โควสุรัตน์ ประธานสภาลมหายใจกรุงเทพมหานคร ได้กล่าวถึงปัญหามลพิษทางอากาศ ว่าเป็นปัญหาที่คนไทยสัมผัสได้ชัดเจนที่สุด ขณะที่ปัญหาการเปลี่ยนแปลงสภาพภูมิอากาศนั้นคนไทยส่วนใหญ่ยังรู้สึกว่าเป็นเรื่องไกลตัว ประธานสภาลมหายใจกรุงเทพมหานคร กล่าวว่า ในปี 2020 ประชาชนในกรุงเทพมหานครสูดฝุ่น PM2.5 โดยเฉลี่ยเทียบเท่ากับการสูบบุหรี่ถึง 1,270 มวนต่อคน และในปีที่ผ่านมามีวันที่อากาศดีเพียง 43 วัน พร้อมทั้งได้อธิบายถึงรูปแบบการเคลื่อนตัวของมลพิษตามฤดูกาลซึ่งได้รับอิทธิพลจากหย่อมความกดอากาศสูงจากประเทศจีนหรือลมหนาวที่พัดมาหลังเทศกาลลอยกระทง ทำให้มลพิษจากการเผาในประเทศเพื่อนบ้านเช่นลาว เวียดนาม และกัมพูชา (ซึ่งกำลังมีการเคลียร์พื้นที่ป่าเพื่อปลูกพืชเศรษฐกิจ) ไหลเข้ามาสะสมในประเทศไทยในช่วงเดือนมกราคม

วีระศักดิ์ ยังได้กล่าวถึงผลการศึกษาของ NASA ที่บินสำรวจในประเทศไทยช่วงเดือนมีนาคม พบว่ากรุงเทพฯ มีระดับโอโซนภาคพื้นดิน (NASA เรียกว่า PM1 หรือที่นักวิทยาศาสตร์เรียกว่า PM0.1) สูงตลอดทั้งปี โดยไม่มีรูปแบบตามฤดูกาลที่ชัดเจน และสูงกว่าเมืองอื่น ๆ ในเอเชียตะวันออกเฉียงใต้หลายแห่ง และย้ำว่าโอโซนภาคพื้นดินเป็นก๊าซพิษที่มีผลกระทบต่อสุขภาพอย่างมาก แหล่งกำเนิดอาจเกี่ยวข้องกับสารอะซิโตไนไตรล์ ซึ่งมาจากสารทำละลายในภาคอุตสาหกรรม ยาฆ่าแมลง เภสัชกรรม และแบตเตอรี่ลิเธียม รวมถึงอาจมีความเชื่อมโยงกับการลักลอบผลิตเมทแอมเฟตามีน วีระศักดิ์ เสนอให้ใช้ “Data-Driven Policy” และสูตร “8-3-1” ในการจัดการปัญหามลพิษ โดยมี AI เป็นเครื่องมือช่วยในการตัดสินใจ ซึ่ง AI จะเป็นผู้ช่วย ไม่ใช่ผู้สั่งการ มนุษย์ยังคงเป็นผู้ตัดสินใจ และสามารถสอน AI ได้ และเสนอให้ BDI ช่วยดึงข้อมูลสำคัญจาก NASA และ NOAA มาจัดเก็บในประเทศ เนื่องจากพวกเขลงทุนไปหลายแสนล้านดอลลาร์สหรัฐ และอาจกำลังจะยกเลิกการสนับสนุนข้อมูลเหล่านั้น

ดร. พีรดล สามะศิริ ผู้จัดการโครงการและนักวิทยาศาสตร์ข้อมูลอาวุโส BDI กล่าวว่า แพลตฟอร์ม EnviLink ที่รวบรวมข้อมูลคุณภาพอากาศจากหลายแหล่ง ให้ประชาชนตรวจสอบได้ และมีแดชบอร์ดสำหรับผู้บริหารจังหวัดเพื่อติดตาม KPI ด้านมลพิษ 4 ตัวหลัก คือ จำนวนวันที่ค่าฝุ่นเกินมาตรฐาน จำนวนจุดความร้อน พื้นที่เผาไหม้ และจำนวนผู้ป่วยโรคระบบทางเดินหายใจ ซึ่งเดิมทีการรวบรวมข้อมูลเหล่านี้อาจต้องใช้บุคลากรจากหลายหน่วยงาน แต่ปัจจุบันแดชบอร์ดช่วยให้ติดตามได้ง่ายขึ้น สำหรับการวิเคราะห์ PM2.5 ในกรุงเทพฯ โดยพิจารณาปัจจัย 3 ด้านคือ สภาพอุตุนิยมวิทยา จำนวนจุดความร้อนรอบข้าง และปริมาณการจราจร

“การจราจรเป็นปัจจัยหนึ่งที่ทำให้ค่าฝุ่นอยู่ในระดับปานกลาง แต่ปัจจัยที่ทำให้ค่าฝุ่นสูงขึ้นจนถึงระดับอันตราย มักจะมาจากสภาพแวดล้อมและแหล่งกำเนิดนอกพื้นที่กรุงเทพฯ เป็นส่วนใหญ่”

ประสบการณ์จากสนามจริง

ในช่วงเสวนา “ประสบการณ์จากสนามจริง การเชื่อมโยงและวิเคราะห์ข้อมูลภาครัฐ” ทีมผู้บริหารโครงการหลักของ BDI ได้ร่วมแบ่งปันความคืบหน้าและความท้าทาย

วรพิชญา ระเบียบโลก ผู้จัดการฝ่ายบริการวิเคราะห์ข้อมูล (DAS) กล่าวว่า ทีม DAS ได้ให้บริการวิเคราะห์ข้อมูลแก่หน่วยงานรัฐหลายแห่ง เช่น ร่วมมือกับสำนักงาน ก.ล.ต. จัดทำฐานข้อมูลงบการเงินเพื่อเฝ้าระวังบริษัทที่อาจมีโอกาสในการฉ้อโกง, ทำแบบจำลองวิเคราะห์ตลาดลอตเตอรี่ให้สำนักงานสลากกินแบ่งรัฐบาลเพื่อนำข้อมูลไปพัฒนาการบริการแก่ผู้ซื้อสลาก, และโครงการ City Data Platform (CDP) ที่จัดสรรคลาวด์กลางให้จังหวัดต่างๆ เพื่อนำข้อมูลในพื้นที่มาบูรณาการ ช่วยแก้ไขปัญหาต่างๆ ได้อย่างทันท่วงที

ดร. พีรดล สามะศิริ ผู้ดูแลทีม D2 Data กล่าวถึงภารกิจสำคัญในการเชื่อมโยงข้อมูลคนเปราะบาง โดยทำงานร่วมกับกระทรวง พม. และหน่วยงานที่เกี่ยวข้องเพื่อให้ข้อมูลจากหลายแหล่งสามารถใช้งานร่วมกันได้ เพื่อระบุตัวตน และส่งเสริมสวัสดิการของกลุ่มคนเปราะบาง เช่น ผู้พิการ ผู้สูงอายุ หรือผู้มีรายได้น้อย คาดว่าจะมีการลงนาม MOU กับประมาณ 30 หน่วยงานในวันที่ 18 มิถุนายนนี้ และอีกโครงการคือการสร้างโครงสร้างพื้นฐานข้อมูลสำหรับอุตสาหกรรม Soft Power เนื่องจากยังขาดกลไกหรือโครงสร้างพื้นฐานที่จะทำให้สามารถเชื่อมโยงข้อมูลจากหลายภาคส่วนเข้ามาทำงานร่วมกันได้ โดยจะเน้นที่ข้อมูลการท่องเที่ยว เทศกาล และเกมเป็นหลัก

ดร. อัญชลิสา แต้ตระกูล รักษาการผู้อำนวยการโครงการ Travel Link กล่าวว่า ปัจจุบันโครงการได้ดำเนินการใน 9 จังหวัด/พื้นที่ และกำลังวางแผนขยายเป็น 22 พื้นที่ โดยจะเน้นข้อมูลการเคลื่อนตัวของนักท่องเที่ยวและการใช้จ่าย และหารือกับผู้ให้บริการทางการเงินรายใหญ่ พร้อมเปิดตัว Travel Data Lab สำหรับฝึกอบรมบุคลากร และ Thavistic แพลตฟอร์ม AI วิเคราะห์รีวิวโรงแรม ซึ่งผู้บริหารโรงแรมสามารถเข้าไปอ่านรายงานที่ Generative AI สร้างขึ้นได้เลย และจะให้บริการฟรีถึงกันยายนนี้ โดย ดร.อัญชลิสากล่าวว่า ในช่วงปีงบประมาณนี้ยังให้บริการฟรี แต่ในปีงบประมาณหน้า อาจจำเป็นต้องขอรับการสนับสนุนค่าใช้จ่ายด้านคลาวด์บ้าง

ดร. สรันธร ผู้สิงห์ ผู้จัดการโครงการ EnviLink กล่าวถึงความร่วมมือกับ Travel Link ในภูเก็ตในการนำ AI มานับจำนวนนักท่องเที่ยวและรถยนต์ในพื้นที่เมืองเก่าภูเก็ต และติดตาม Carbon Footprint รวมถึงโครงการแยกขยะในชุมชน นอกจากนี้ยังร่วมมือกับ Clean Air Fund และ มจธ. ในการจัดทำแผนที่กลุ่มเปราะบางในกรุงเทพฯ และร่วมมือกับ วช. สกสว. และนักวิจัยในเชียงใหม่เพื่อดูแลพื้นที่ 8 จังหวัดภาคเหนือตอนบน โดยเน้นการพิจารณาว่าพื้นที่ใดมีศักยภาพในการปรับเปลี่ยนจากการปลูกข้าวโพดที่ต้องเผา ไปเป็นการปลูกพืชชนิดอื่น เช่น แมคคาเดเมียหรือกาแฟได้

น้ำฝน ประภาศรี ผู้อำนวยการโครงการ Health Link กล่าวว่า Health Link ได้เชื่อมโยงข้อมูลสุขภาพจากโรงพยาบาลราวสองพันแห่ง และร่วมมือกับ สปสช. ในโครงการ “30 บาทรักษาทุกที่” ขยายการเชื่อมต่อไปยังหน่วยบริการปฐมภูมิ ซึ่งใน กทม. เชื่อมต่อได้เกือบร้อยเปอร์เซ็นต์ และคาดว่าจะขยายไปอีกกว่าหนึ่งหมื่นแห่งทั่วประเทศ มีการเชื่อมต่อกับระบบ HIS เกือบ 25 ยี่ห้อ และได้ integrate ระบบ Health Link เข้าไปแล้วประมาณ 15 ยี่ห้อ รวมถึงแอปสุขภาพต่าง ๆ และกำลังพัฒนา Health Analytics เพื่อวิเคราะห์การเจ็บป่วยด้วยโรคต่าง ๆ และติดตามผลนโยบายการเข้าถึงบริการสุขภาพของประชาชน

ปฏิภาณ ประเสริฐสม ผู้จัดการโครงการ Thai LLM กล่าวว่า โครงการนี้เป็นความร่วมมือกับหลายภาคส่วน มี 4 กิจกรรมหลักคือ การรวบรวมข้อมูลภาษาไทย เนื่องจากมีหลายทีมในประเทศไทยที่กำลังพัฒนา LLM อยู่แล้ว จึงต้องการสร้างแหล่งข้อมูลกลางที่มีความร่วมมือกัน, การพัฒนา Foundation Model ภาษาไทยโอเพนซอร์ส โดยนำโมเดลโอเพนซอร์สที่มีอยู่มาฝึกสอนต่อด้วยข้อมูลภาษาไทย, การสร้าง Use Case ต้นแบบ เช่น Chatbot ทางการแพทย์สำหรับการดูแลเชิงป้องกัน ซึ่งอาจไม่ใช่การรักษาหรือวินิจฉัยโรคโดยตรง, และการสร้าง Ecosystem โดยย้ำว่าข้อมูลภาษาไทยบนอินเทอร์เน็ตมีเพียง 0.5% จึงขอเชิญชวนทุกภาคส่วนร่วมสนับสนุนข้อมูล

การจัดงานครบรอบ 2 ปีของ BDI ในครั้งนี้ ไม่เพียงแต่เป็นการสรุปผลงานและความสำเร็จ แต่ยังเป็นการประกาศความพร้อมและทิศทางที่ชัดเจนในการนำพาประเทศไทยก้าวสู่ยุคดิจิทัลอย่างเต็มศักยภาพ โดยอาศัยพลังของข้อมูลขนาดใหญ่และปัญญาประดิษฐ์เป็นเครื่องมือสำคัญในการสร้างความเปลี่ยนแปลงและพัฒนาประเทศในทุกมิติ