टेन्सरफ्लो लाइट पोझेनेट किंवा पोझ एस्टीमेशन हे एखाद्या एमएल मॉडेलचा वापर करून एखाद्या प्रतिमेत किंवा व्हिडिओवरून एखाद्या व्यक्तीच्या पोझचा अंदाज लावून शरीरातील की (सांधे असलेल्या कीपॉइंट्स) च्या अवकाशासंबंधी जागांचा अंदाज लावणे शक्य आहे.
ठराविक अंदाज संगणकाच्या दृष्टीकोण तंत्राचा संदर्भ देते ज्या प्रतिमा आणि व्हिडिओंमध्ये मानवी आकडेवारी ओळखतात, जेणेकरुन एखादी व्यक्ती कोपर एखाद्या प्रतिमेमध्ये कोठे दिसते हे निश्चित करू शकेल. हे महत्वाचे आहे की आपण जागरूक असणे आवश्यक आहे की पोझिशियल अंदाज फक्त अंदाज लावतो की शरीरातील मुख्य सांधे कोठे आहेत आणि प्रतिमा किंवा व्हिडिओमध्ये कोण आहे हे ओळखत नाही.
पॉसनेट मॉडेल इनपुट म्हणून प्रक्रिया केलेल्या कॅमेरा प्रतिमा घेते आणि की पॉइंट्सबद्दल माहिती आउटपुट करते. आढळलेल्या की पॉइंट्स 0.0 आणि 1.0 दरम्यानच्या आत्मविश्वास स्कोरसह भाग आयडीद्वारे अनुक्रमित केले जातात. आत्मविश्वास स्कोअर त्या स्थितीत एक कीपॉईंट अस्तित्त्वात असल्याची संभाव्यता दर्शवितो.
कामगिरी बेंचमार्क
कार्यप्रदर्शन आपल्या डिव्हाइसवर आणि आउटपुट स्ट्राईड (हीटमॅप्स आणि ऑफसेट वेक्टर) वर आधारित असते. पोसनेट मॉडेल प्रतिमेचा आकार बदलणारा आहे, ज्याचा अर्थ असा आहे की प्रतिमेची प्रतिमा खाली पडली आहे की नाही याकडे दुर्लक्ष करून मूळ प्रतिमेच्या समान प्रमाणात पोझिशन्स पोझिशन्स ठेवू शकतात. याचा अर्थ असा की आपण कार्यक्षमतेच्या खर्चावर मॉडेलला अधिक अचूकता कॉन्फिगर केले आहे.
इनपुट प्रतिमेच्या आकाराशी निगडीत आउटपुट किती मोजले जाईल हे आउटपुट चरण निश्चित करते. हे थरांचा आकार आणि मॉडेल आउटपुटवर परिणाम करते.
आउटपुट स्ट्रीड जितके जास्त असेल तितके नेटवर्कमधील थरांचे रिझोल्यूशन आणि आउटपुट जितके लहान असेल तितकेच त्यांची अचूकता असेल. या अंमलबजावणीमध्ये, आउटपुट चरणात 8, 16 किंवा 32 ची मूल्ये असू शकतात. दुस words्या शब्दांत, 32 च्या आउटपुट टप्प्यात सर्वात वेगवान कामगिरी होईल परंतु सर्वात कमी अचूकता येईल, तर 8 मध्ये सर्वात जास्त अचूकता परंतु हळू कामगिरी होईल. शिफारस केलेली प्रारंभ मूल्य 16 आहे.