ปัญญาประดิษฐ์ประกอบด้วยสาขาต่างๆ หลายรายการต้องการการจับหรือตีความสัญญาณจากต่างประเทศ. ในโพสต์นี้ เราจะเห็นเครื่องมือโอเพ่นซอร์สสำหรับการมองเห็นของคอมพิวเตอร์
เป็นหนึ่งในหลายสนาม ที่ซึ่งซอฟต์แวร์ฟรีและโอเพ่นซอร์สเป็นผู้นำ มีประสิทธิภาพดีกว่าทางเลือกที่เป็นกรรมสิทธิ์
ดัชนี
คอมพิวเตอร์วิทัศน์คืออะไร?
คอมพิวเตอร์สามารถจับภาพได้มานานแล้วแต่ การทำให้เขารับรู้และตอบสนองต่อสิ่งเหล่านี้เป็นสาขาที่ได้รับความนิยมในช่วงไม่กี่ปีที่ผ่านมา ความสนใจในความสามารถประเภทนี้เพิ่มขึ้นจากความพยายามในการปรับปรุงเทคโนโลยีการจดจำใบหน้าและการแข่งขันเพื่อพัฒนายานพาหนะไร้คนขับคันแรก
ความท้าทายคือการสร้างอัลกอริธึมที่สามารถจดจำรูปร่าง สี และรูปแบบในภาพที่ถ่ายโดยคอมพิวเตอร์ตลอดจนตรวจจับความเคลื่อนไหว ติดตามสิ่งของ และทำความเข้าใจตำแหน่งเชิงพื้นที่ เครื่องมือที่ทรงพลังที่สุดใช้อัลกอริทึมการเรียนรู้เชิงลึกที่ได้รับการฝึกฝนจากรูปภาพที่รู้จักนับล้าน ซึ่งจะช่วยให้คุณจดจำรูปแบบและคาดการณ์ได้ในอนาคต
นอกจากยานยนต์ไร้คนขับแล้ว ยังมีการใช้งานอื่นๆ ที่เป็นไปได้ เช่น การวิเคราะห์ภาพทางการแพทย์หรือการตรวจจับข้อบกพร่องในผลิตภัณฑ์ที่ผลิตซึ่งมองไม่เห็นด้วยตามนุษย์
อัลกอริทึมการเรียนรู้เชิงลึกแตกต่างจากอัลกอริทึมการเรียนรู้แบบดั้งเดิม โดยอาศัยโครงข่ายประสาทเทียมหลายชั้นที่สามารถเรียนรู้โดยการดึงข้อมูลที่เกี่ยวข้องจากข้อมูลอินพุตด้วยตัวเอง
เครื่องมือโอเพ่นซอร์สสำหรับคอมพิวเตอร์วิทัศน์
ห้องสมุดวิสัยทัศน์คอมพิวเตอร์คือ ชุดของโปรแกรมที่เขียนไว้ล่วงหน้าซึ่งสามารถใช้งานได้โดยแอปพลิเคชันที่กำลังพัฒนาซึ่งต้องการความสามารถในการประมวลผลภาพและวิดีโอ. การใช้ไลบรารีเหล่านี้ช่วยให้คุณลดเวลาการเขียนโค้ดได้
OpenCV
Es ร้านหนังสือที่ได้รับความนิยมมากที่สุดในรายการนี้ มีเวอร์ชันสำหรับภาษาโปรแกรม Python, Java, C++ และ Javascript เป็นต้น สามารถรวมอยู่ในแอปพลิเคชันสำหรับ Windows, Mac และ Android
การใช้งานบางอย่างของ OpenCV ได้แก่ การจดจำใบหน้า การตรวจจับการเคลื่อนไหว การระบุท่าทาง และการตรวจจับวัตถุ
SimpleCV
มันเกี่ยวกับ ของชุดซอฟต์แวร์และไลบรารี่ที่พัฒนาใน Python เหมาะอย่างยิ่งสำหรับการสร้างต้นแบบแอปพลิเคชันที่เข้ากันได้กับกล้องบนเว็บ, IP และอุปกรณ์พกพาต่างๆ
ไม่จำเป็นต้องเรียนรู้มากเท่ากับตัวเลือกอื่นๆ
ดีพเฟซ
โคโม ชื่อของเขา ระบุว่าเป็นเครื่องมือสำหรับทำงานกับใบหน้า เป็นไลบรารีสำหรับ Python ที่ให้คุณวิเคราะห์ใบหน้าแบบเรียลไทม์ จดจำใบหน้า ดำเนินการตรวจสอบ และวิเคราะห์คุณลักษณะของใบหน้า
บูฟCV
ซอฟต์แวร์นี้ มันถูกเขียนขึ้นใหม่ทั้งหมดและมุ่งเน้นไปที่การประมวลผลภาพระดับต่ำ การปรับเทียบกล้อง การตรวจจับ/การติดตามคุณสมบัติ รูปแบบการเคลื่อนไหว และการจดจำ ทั้งหมดนี้แบบเรียลไทม์
โอเพ่นไวน์
ชื่อ ของไลบรารีนี้มาจากคำย่อของ Open Visual Inference และ Neural Network Optimization ประกอบด้วยชุดเครื่องมือสำหรับปรับแต่งแอพพลิเคชั่นที่เลียนแบบการมองเห็นของมนุษย์ การใช้งานจำเป็นต้องมีแบบจำลองที่ผ่านการฝึกอบรมมาล่วงหน้า การใช้งานนี้มีไว้สำหรับการตรวจจับวัตถุ การจดจำใบหน้าและการเคลื่อนไหว และการลงสี
อัลบั้ม
Es ไลบรารี Python ที่ใช้สำหรับการจำแนกรูปภาพ การประมาณค่าท่าทาง และการตรวจจับวัตถุ
Caffe
เป็นที่สงสัยว่าชื่อย่อของปัญญาประดิษฐ์หมายถึงอาหารไวน์อย่างไร, กาแฟ. ในกรณีหลังนี้หมายถึง Convolutional Architecture สำหรับการฝังคุณลักษณะที่รวดเร็ว มันเขียนด้วย C ++ แม้ว่ามันจะรองรับหลายภาษาและสถาปัตยกรรมการเรียนรู้เชิงลึกที่หลากหลาย เหมาะอย่างยิ่งสำหรับการจำแนกประเภทและการแบ่งส่วนภาพ ทำให้เหมาะสำหรับโครงการวิจัยเชิงวิชาการ ต้นแบบผลิตภัณฑ์ และการใช้งานทางอุตสาหกรรมขนาดใหญ่ที่ต้องการความสามารถในการมองเห็น เสียง และมัลติมีเดีย
เห็นได้ชัดว่ายังมีอีกมากที่ต้องทำในด้านปัญญาประดิษฐ์ แต่การมีอยู่ของไลบรารีโอเพ่นซอร์สทำให้เราหวังว่าโซลูชันที่พัฒนาขึ้นนั้นไม่ได้ถูกควบคุมโดยคนไม่กี่คน
เป็นคนแรกที่จะแสดงความคิดเห็น