Да бисте издвојили све напомене о објектима из одговора АПИ-ја у области вештачке интелигенције – Гоогле Висион АПИ – Напредно разумевање слика – Откривање објеката, можете да користите формат одговора који пружа АПИ, који укључује листу откривених објеката заједно са њиховим одговарајућим граничне кутије и резултати самопоуздања. Рашчлањивањем овог одговора можете издвојити напомене жељеног објекта.
АПИ одговор се обично састоји од ЈСОН објекта који садржи различита поља, укључујући поље „лоцализедОбјецтАннотатионс“, које садржи откривене објекте. Свака напомена објекта укључује информације као што су име објекта, његове граничне координате и оцену поузданости која указује на поверење АПИ-ја у детекцију.
Да бисте издвојили напомене објеката, можете да пратите ове кораке:
1. Парсирајте АПИ одговор: Почните рашчлањивањем ЈСОН одговора примљеног од АПИ-ја. Ово се може урадити помоћу ЈСОН библиотеке за рашчлањивање или уграђених функција које обезбеђује ваш програмски језик.
2. Приступите пољу „лоцализедОбјецтАннотатионс“: Када се одговор рашчлани, приступите пољу „лоцализедОбјецтАннотатионс“, које садржи откривене објекте. Ово поље је обично низ напомена објеката.
3. Итерација кроз коментаре објеката: Итерација кроз сваку напомену објекта у низу. Свака напомена представља откривени објекат на слици.
4. Издвој релевантне информације: Издвоји релевантне информације из сваке напомене објекта, као што су име објекта, координате оквира и резултат поузданости. Овим детаљима се може приступити као засебним пољима унутар сваке напомене објекта.
5. Чувајте или обрадите издвојене информације: У зависности од ваших захтева, екстраховане информације можете ускладиштити у структури података или их даље обрадити за анализу или друге сврхе. На пример, можда ћете желети да сачувате имена објеката и њихове одговарајуће координате оквира у бази података или да их користите за даље задатке разумевања слике.
Ево поједностављеног примера који илуструје процес екстракције:
python import json # Assume 'response' contains the API response in JSON format response =
{
"лоцализедОбјецтАннотатионс": [
{
"средина": "/м/01г317",
"име": "мачка",
"сцоре": 0.89271355,
"боундингПоли": {
"нормализедВертицес": [
{"к": 0.1234, "и": 0.5678},
{"к": 0.5678, "и": 0.1234}
] }
},
{
"средина": "/м/04рки",
"име": "пас",
"сцоре": 0.8132468,
"боундингПоли": {
"нормализедВертицес": [
{"к": 0.4321, "и": 0.8765},
{"к": 0.8765, "и": 0.4321}
] }
}
] }
# Parse the API response response_data = json.loads(response) # Access the object annotations annotations = response_data['localizedObjectAnnotations'] # Iterate through the object annotations for annotation in annotations: # Extract relevant information object_name = annotation['name'] bounding_box = annotation['boundingPoly']['normalizedVertices'] confidence = annotation['score'] # Process or store the extracted information print(f"Object: {object_name}, Bounding Box: {bounding_box}, Confidence: {confidence}") # Output: # Object: cat, Bounding Box: [{'x': 0.1234, 'y': 0.5678}, {'x': 0.5678, 'y': 0.1234}], Confidence: 0.89271355 # Object: dog, Bounding Box: [{'x': 0.4321, 'y': 0.8765}, {'x': 0.8765, 'y': 0.4321}], Confidence: 0.8132468
У овом примеру претпостављамо да ЈСОН одговор садржи два откривена објекта: мачку и пса. Код анализира одговор, приступа пољу „лоцализедОбјецтАннотатионс“, пролази кроз сваку напомену објекта и извлачи име објекта, координате оквира и оцену поузданости. Коначно, извучене информације се штампају, али можете модификовати код како би одговарао вашим специфичним потребама.
Пратећи ове кораке, можете ефикасно да издвојите све напомене објеката из одговора АПИ-ја у области вештачке интелигенције – Гоогле Висион АПИ – Напредно разумевање слика – Откривање објеката.
Остала недавна питања и одговори у вези Напредно разумевање слика:
- Које су неке унапред дефинисане категорије за препознавање објеката у Гоогле Висион АПИ-ју?
- Који је препоручени приступ за коришћење функције детекције безбедне претраге у комбинацији са другим техникама модерирања?
- Како можемо да приступимо и прикажемо вредности вероватноће за сваку категорију у напомени безбедне претраге?
- Како можемо да добијемо напомену о безбедној претрази користећи Гоогле Висион АПИ у Питхон-у?
- Којих је пет категорија укључених у функцију откривања безбедне претраге?
- Како функција безбедне претраге Гоогле Висион АПИ-ја открива експлицитан садржај у сликама?
- Како можемо визуелно идентификовати и истаћи откривене објекте на слици користећи библиотеку јастука?
- Како можемо организовати екстраховане информације о објекту у табеларном формату користећи оквир података пандас?
- Које библиотеке и програмски језик се користе за демонстрирање функционалности Гоогле Висион АПИ-ја?
- Како Гоогле Висион АПИ врши откривање и локализацију објеката на сликама?
Погледајте више питања и одговора у Напредном разумевању слика