DATA SCIENTIST – นักวิทยาศาสตร์ข้อมูล เป็นอาชีพที่กำลังมาแรงจริงหรือ? Version คุยกับลูก

DATA SCIENTIST

Data Scientist เป็นอาชีพแรกที่เลือกนำมาเขียน เพราะถือได้ว่าเป็นอาชีพที่พูดถึงกันเยอะในช่วง 5 ปีมานี้ ผมก็โม้ให้ลูกฟัง โน่น นี่ นั่น แบบถูกๆผิดๆ เพราะก็แค่เห็นผ่านตามาคร่าวๆ แต่…ไม่เป็นไร ในฐานะที่พอรู้เรื่องเกี่ยวกับ Business Intelligent(BI) – Data Warehouse – Data Mining etc. มาบ้าง ก็พอจะถูๆ ไถๆ ไปได้บ้าง ไปหาข้อมูลเพิ่ม จับมาต่อยอด  วิธีการง่ายที่สุดสำหรับผมที่จะหาว่า อาชีพนี้ ทำอะไร อย่างไรบ้าง ก็คือ เข้าไป Search หาใน website ของบริษัทจัดหางานต่างๆเช่น JobDB – JobThai – Linkedin etc. ก็จะเริ่มเห็นละครับว่า เนื้องานมีอะไรบ้าง แต่บริษัทพี่ไทยหลายแห่ง เล่นเหมารวมเกือบทุกหน้าที่ที่เกี่ยวข้องกับข้อมูลให้ data scientist หมดเลย … เอาหน่า มีงานทำก็ยังดีกว่าไม่มีนะ

ประเด็นอยู่ที่ว่า เวลาเราคุยกับลูก เราไม่สามารถบอกในรูปแบบที่เรารับรู้มาได้ทั้งหมด ยังไงก็ต้องมีการแปลงเพื่อให้สามารถเข้าใจได้แบบบ้านๆ คือเมื่อก่อนที่เราเคยทำงาน เราก็ไปข้องเกี่ยวกับเนื้องานทางด้าน database พอสมควร ในสมัยที่ CIO หรือ IT Director ยังเรียกกันว่า EDP Manager (Electronic Data Processing Manager) ก็เลยพอจะรู้ระแคะระคายได้บ้างว่า เนื้องานในวงการคอมพิวเตอร์มีอะไรอย่างไรบ้าง ถึงแม้จะไม่ใช่ทั้งหมด แต่ก็พอจะกล่าวถึงงานที่เห็นๆกันอยู่ในวงการพอได้อยู่

แต่พอตอนมาโม้ให้ลูกฟัง ถึงเรื่อง Data Scientist ก็จะพล่ามก่อนเลยว่า ในวงการคอมพิวเตอร์ก่อนหน้านี้ มีตำแหน่งอะไรแล้วทำหน้าที่อะไรบ้าง สมัยป๊าม๊าทำงานเริ่มแรกเป็นอย่างไร ทุกวันนี้เปลีี่ยนไปอย่างไร ก็ว่ากันไปในเนื้องานของ programmer, system analyst, system integration, business analyst etc. รวมทั้ง application ต่างๆที่ใช้กันอยู่ในวงการธุรกิจปัจจุบัน ทั้งด้าน financial, manufacturing, logistic, business intelligence, บรา ๆ ๆ ว่ามันเป็นอย่างไรบ้าง แล้วก้อ พอ ! … เดี๋ยวจะงงกว่าเก่าอีก

แล้ว data scientist หละทำไร? . . . . . ถาม google สิครับ อ่านๆ แล้วสะเด็ดน้ำตามที่พอเข้าใจ เอามาเล่าให้ลูกฟัง ไม่ต้องยาวมาก ยิ่งยาวยิ่ง งง  เพราะเราไม่รู้จริง อิอิ


สิ่งที่เล่าให้ลูกฟังมีประมาณนี้

เป็นการนำเสนอ การคาดการณ์ การพยากรณ์ การแก้ไขโจทย์ แก้ไขปัญหา หรือ ให้คำปรึกษาโดยการนำข้อมูลในรูปแบบต่างๆ นำมาจัดให้อยู่ในรูปแบบที่สามารถนำไปใช้ประโยชน์ได้ง่าย และ data scientist จะต้องคิดค้นหาวิธีการหรือรูปแบบในการวิเคราะห์ วิจัย ทำให้ข้อมูลเหล่านั้นสามารถนำไปก่อเกิดประโยชน์ต่อองค์กรในรูปแบบต่างๆ โดยอาจจะเป็นการนำเสนออะไรใหม่ๆที่โดนๆ โดยไม่ต้องมีโจทย์ขึ้นมาก่อนก็เป็นได้ (คิดว่า…ลูกจะงงไหม? … ไม่งง ก็โม้ต่อ) หรือใช้ในการปรับปรุงผลิตภัณฑ์ เพื่อเป็นแนวทางสำหรับธุรกิจในอนาคตด้วยก็ได้ . . .

โห . .. งานเยอะหงะ

ในเส้นทางกว่าจะได้มาซึ่งการตอบโจทย์หรือผลลัพท์ อาจจะมีผู้ร่วมงานที่ทำหน้าที่ต่างๆ ขึ้นอยู่กับขนาดของ project  และ data ไม่ใช่ให้เราทำคนเดียวทั้งหมด …. แต่ไม่แน่นะ ในบางบริษัทอาจจะต้องทำคนเดียวตั้งแต่ต้นจนจบก็ได้ 5 5 5 แต่ส่วนใหญ่แล้ว บริษัทหรือองค์กรที่จะนำเรื่องนี้มาใช้ มักจะเป็นองค์กรขนาดใหญ่ ก็มักจะทำงานกันเป็นทีมเลย

ยกตัวอย่างเช่น Application ของ UBER หรือ GRAB 

(แฮ่มมม เพิ่งเคยใช้งานไม่กี่ครั้ง ก็เอามาโม้ละ จะรู้อะไรบ้างเนี๊ยะ) ลองนึกภาพดูในแบบผู้ใช้งานแบบพวกเราว่า มันจะต้องมีข้อมูลอะไรมาเกี่ยวข้องบ้าง? . . . . คิด ๆ ๆ ที่เขียนต่อไปนี้ คิดเอง เดาเอง แบบคิดว่ายังไงเราก็รู้มากกว่าลูกอยู่หน่อยนึงหละ อิอิ

  • User หรือ ลูกค้า แน่นอนเลย ข้อมูลรายละเอียดประวัติเรา เพศ วัย ทำงานอะไร แถมบางทีมีข้อมูลบัตรเครดิตอีกต่างหาก
  • ประวัติการใช้งานของเรา
  • รถและคนขับ อันนี้ก็สำคัญยังไงก็ต้องมีประวัติของคนขับ ซึ่ง รวมไปถึง history ต่างๆในการให้บริการด้วย
  • แผนที่ เพราะเวลาเราเปิดเข้าไปก็เจอหน้าแผนที่พร้อมกับข้อมูล online data ต่างๆ ทั้งตำแหน่งที่อยู่ของเรา ของรถ ข้อมูลจราจร ซึ่งอาจจะได้มาจากหลายๆแหล่ง
  • ข้อมูลอื่นๆอีกมากมาย (เอาจริงๆก็คือ เราไม่รู้ 5 5 5)

พูดแบบนี้ เด็กๆน่าจะนึกภาพออก เพราะเราเปิด App ให้ดูด้วย ลองนึกภาพดูว่า จะต้องเขียน Model และ แปลงออกมาเป็น กระบวนการอย่างไร จึงเกิดผลลัพท์เป็นแบบ GRAB app ที่เราใช้อยู่ในปัจจุบัน นั่นแหละคือสิ่งที่พวก data scientist – data engineer – etc. จะต้องช่วยกันทำออกมา

บางครั้งก็ไม่ไช่ว่าตื้นๆจับแพะชนแกะ ลูกค้าอยู่ตรงนี้ มีรถคันไหนอยู่แถวๆนั้นบ้าง เพราะอาจจะเขียน model คิดเผื่อเลยก็ได้ว่า คนขับคนนี้ ชอบวิ่งในย่านไหน ปลายทางลูกค้าอยู่ไหน ถ้าไม่ตรงกันมากนัก ก็ไม่ต้อง blink blink หรือไม่ match กันก็ได้ เอาที่สบายใจ อิอิ แล้วแต่จะคิด แล้วแต่จะตั้งโจทย์ แล้วแต่จะตั้งสมมุติฐานกันเลย

ในแง่ของประวัติลูกค้า และ ประวัติคนขับ ก็สามารถนำมาร่วมประมวลได้ ขึ้นอยู่กับว่าเราจะตั้งโจทย์อย่างไร จะมี requirement แบบไหน เขียน model แบบใด บลา ๆ ๆ

นี่ยังไม่รวมงานโปรโมชั่นอื่นๆอีกนะ ที่นำเอาข้อมูลไปคิดต่อยอด . . . เล่นกับข้อมูลมันก็เหนื่อยและสนุกอย่างนี้แหละ

นอกจากนี้ ก็น่าจะเป็นพวก google map, weather forecast, งานด้านการธนาคารต่างๆ ทั้งการปล่อยกู้  การประเมินเครดิตต่างๆ ฯลฯ

วันก่อนเคยดูอาจารย์นิด้าท่านหนึ่งยกตัวอย่างเรื่องการใช้ประโยชน์จากข้อมูลรูปแบบต่างๆรวมทั้งข้อมูลจาก facebook ในการนำมาวิเคราะห์และหา Solution ว่า บุคคลคนนี้ควรจะได้รับเครดิตหรือไม่? ขนาดไหน?

เฮอะๆ ข้อมูลจาก facebook นี่หงะนะ เป็นไปได้หรอ?

หลักการก็คือ เขาก็จะูว่า บุคคลคนนี้ ในช่วง timeline ย้อนหลังเป็นเวลาหลายๆปี

  • มีเพื่อน คุยโต้ตอบกับเพื่อน เพื่อนของเขานั้นเป็นบุคคลที่มีชื่อเสียง น่าเชื่อถือ(จะรู้ได้ไง คิดในใจ) มากน้อยขนาดไหน
  • ไปเที่ยวที่ไหนมาบ้าง สถานที่อยู่ในเกรดไหน
  • กิน ดื่ม จากร้านค้า หรือ ภัตราคารแบบไหน
  • พักโรงแรมระดับไหนบ้าง
  • ฯลฯ

แล้ว สิ่งที่ได้ออกมาก็คือ ควรให้บุคคลคนนี้กู้หรือไม่? มากน้อยขนาดไหน?

คิดได้เนอะ แต่เอาไปใช้จริงได้หรือปล่าวก็ต้องว่ากันอีกที


ชีวิตการทำงาน

ตั้งแต่ทำงานมา ยังไม่เห็นใครทำงานคอมพิวเตอร์แล้วสบายเลย …. อ่าว ป๊า ไฉนพูดอย่างนั้นหละ?

โดยเฉพาะอย่างยิ่งเด็กจบใหม่ๆไฟแรง ก็ต้องพยายามหาความรู้ หาประสบการณ์เพิ่มเติมให้มากเข้าไว้ แต่ก็ไม่ได้หมายความว่าจะทิ้งเรื่องทางโลกหรือทางสังคมไปเลย ต้องจัดการกับชีวิตตัวเองให้เหมาะสม แต่ที่เห็นอยู่บ่อยๆก็คือ คนทำงานคอมพิวเตอร์มักจะขลุกอยู่หน้าจอ สมัยป๊าทำงานช่วงแรกๆก็ทำกันโต้รุ่งสามสี่คืนก็ยังมี มันอยู่ที่ความตั้งใจ ความมุ่งมั่น และสิ่งที่เราอยากจะเห็นในตอนสิ้นสุดโครงการ จะเห็นว่าพวก Software House มักจะมีห้องนอน ห้องพักผ่อน ห้องนั่งเล่น ห้องอาบน้ำ ให้พนักงานด้วย . . . (ขู่ลูก อิอิ) แต่พองานเสร็จงานจบตรงเป้าหมายตามเวลา ก็จะรู้สึกภาคภูมิใจ รู้สึกมีพลังอยากจะเจอเรื่องใหม่ๆอีก แต่ยังไงก็ปลีกตัวไปพักผ่อนก่อนด้วยนะ

ลักษณะนี้ จะค่อยๆเปลี่ยนไปตามกาลเวลาและตำแหน่งหน้าที่ความรับผิดชอบ . . หน้าที่เปลี่ยนไป เนื้องานก็เปลี่ยนไป ตำแหน่งเปลี่ยนไป ลักษณะความรับผิดชอบก็เปลี่ยนไปด้วย แต่ยังไงเสีย … ตอนนี้ หาที่เรียนให้ได้ก่อนนะ

แต่ก็ไม่แน่เสมอไปนะ ยุคสมัยมันเปลี่ยนแปลงไปละ วิธีการทำงานแบบ Generation ปัจจุบันอาจจะง่ายกว่าแต่ก็ได้ผลลัพท์ที่เหมือนกัน


จะทำงานสายนี้ ต้องเรียนคณะอะไร? มีที่ไหนสอนบ้าง?

จริงๆแล้วเท่าที่ตามอ่านมาจากหลายๆกูรู หลายๆบทความ ถ้านอกเหนือจากสาขาที่ตรงเด๊ะทั้งตัวอักษร Data Science แล้วก็ยังมีคณะและสาขาวิชาอื่นๆอีกที่อยู่ใน qualification ที่ทางผู้จ้างงานกำหนดไว้เช่น Mathematics, สถิติประยุกต์, วิศวกรรมคอมพิวเตอร์, เทคโนโลยีสารสนเทศ และอีกหลากหลายตามแต่จะตั้งชื่อกัน เพราะเดี๋ยวนี้ชื่อคณะ ชื่อสาขาวิชา บางทีหลักสูตรเหมือนกันก็เรียกไม่เหมือนกันในบางมหาวิทยาลัย ดังนั้น บางครั้งเราต้องเข้าไปดูรายละเอียดของหลักสูตรด้วยว่าคือสิ่งที่เรากำลังตามหาอยู่หรือไม่ !

ลองหามาให้คร่าวๆ นะครับ ยังมีอีกมากมายลองค้นหาดูนะครับ

สถาบันเทคโนโลยีพระจอมเกล้า ลาดกระบัง

จุฬาลงกรณ์มหาวิทยาลัย

มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าธนบุรี

มหาวิทยาลัยเทคโนโลยีพระจอมเก้า พระนครเหนือ

มหาวิทยาลัยธรรมศาสตร์

มหาวิทยาลัยมหิดล


บทสรุป

จะไม่ได้ลงลึกไปถึงว่าต้องมีองค์ความรู้วิชาอะไรอย่างไรมาบ้างนะครับ ไม่ได้ไปข้องแวะพวกรายละเอียด machine learning, deep learning, data visualization, data mining, data warehouse บลา ๆ ๆ

แหละเชื่อว่า Data Scientist ยังคงเป็นที่ต้องการในตลาด โดยส่วนใหญ่เราจะเห็นว่ามักจะเป็นองค์กรหรือบริษัทใหญ่ๆ ธุรกิจเกี่ยวกับ financial ธนาคาร ผู้ให้บริการประเภทต่างๆ ฯลฯ ที่จะประกาศรับสมัครงานในตำแหน่งนี้ ลองดูนะครับ ลองดูประกาศและ JD ของตำแหน่งนี้ที่บริษัทต่างๆกำหนดให้นะครับ


ม.4 ละ . . . ชวนลูกค้นหาอาชีพกัน