안녕하세요, 즐로그 운영자입니다!
오늘은 문서·텍스트 분석부터 이미지 인식까지, OCR·NLP·Computer Vision(CV) 분야에서
Azure Cognitive Services와 Google Cloud AI 플랫폼을 한눈에 비교하고,
실전에서 바로 써먹을 수 있는 활용 팁과 코드 스니펫까지 싹 정리해드릴게요~ 😉
⸻
📋 목차
1. OCR 서비스 비교
2. NLP 서비스 비교
3. CV(Computer Vision) 서비스 비교
4. 활용 팁 & 추천 시나리오
5. 마무리
⸻
📖 1️⃣ OCR 서비스 비교
구분 Azure (Cognitive Services) GCP (Vision API & Document AI)
핵심 제품 Computer Vision OCR, Form Recognizer Vision API Text Detection, Document AI
정밀도 다국어 문자 인식, 레이아웃 분석 지원 구조화 문서 파싱 강점
파일 형식 JPG/PNG/PDF, 스캔 문서 JPG/PNG/PDF, PDF 레이아웃 보존
추가 기능 표·테이블 인식, 필드 추출(Form) 계약서·청구서 전용 파이프라인
API 엔드포인트 REST, SDK (Python/Node.js 등) REST, gRPC, Client Libs
🔧 코드 스니펫: Azure Form Recognizer (Python)
from azure.ai.formrecognizer import DocumentAnalysisClient
from azure.core.credentials import AzureKeyCredential
endpoint = "https://<YOUR_REGION>.api.cognitive.microsoft.com/"
key = "<YOUR_KEY>"
client = DocumentAnalysisClient(endpoint, AzureKeyCredential(key))
poller = client.begin_analyze_document("prebuilt-document", {"url": "<YOUR_FILE_URL>"} )
result = poller.result()
for page in result.pages:
for line in page.lines:
print(line.content)
🔧 코드 스니펫: GCP Document AI (Python)
from google.cloud import documentai_v1 as documentai
client = documentai.DocumentProcessorServiceClient()
name = client.processor_path("YOUR_PROJECT","us","YOUR_PROCESSOR_ID")
with open("invoice.pdf", "rb") as f:
doc = {"content": f.read(), "mime_type": "application/pdf"}
request = {"name": name, "raw_document": doc}
response = client.process_document(request=request)
for page in response.document.pages:
for line in page.layout.text_lines:
print(line.layout.text_anchor.content)
⸻
✍️ 2️⃣ NLP 서비스 비교
구분 Azure (Text Analytics & LUIS) GCP (Natural Language API)
감정 분석(Sentiment) Text Analytics Natural Language API
개체 인식(NER) Text Analytics Natural Language API
언어 이해(LUIS/Custom) LUIS, Language Studio AutoML Natural Language, Vertex AI
다국어 지원 120개 이상 20개 이상
배포 옵션 Custom 모델 배포 가능 AutoML 모델 · Endpoint
🔧 코드 스니펫: Azure Text Analytics (Python)
from azure.ai.textanalytics import TextAnalyticsClient
from azure.core.credentials import AzureKeyCredential
ta_endpoint = "https://<YOUR_REGION>.api.cognitive.microsoft.com/"
ta_key = "<YOUR_KEY>"
ta_client = TextAnalyticsClient(endpoint=ta_endpoint, credential=AzureKeyCredential(ta_key))
doc = ["이 제품 정말 좋네요! 하지만 배송이 좀 늦었어요."]
response = ta_client.analyze_sentiment(doc)
for doc in response:
print(f"Sentiment: {doc.sentiment}, 긍정 점수: {doc.confidence_scores.positive:.2f}")
🔧 코드 스니펫: GCP Natural Language API (Python)
from google.cloud import language_v1
client = language_v1.LanguageServiceClient()
doc = language_v1.Document(content="이 제품 정말 좋습니다!", type_=language_v1.Document.Type.PLAIN_TEXT)
sentiment = client.analyze_sentiment(request={"document": doc}).document_sentiment
print(f"Sentiment score: {sentiment.score}, Magnitude: {sentiment.magnitude}")
⸻
🎯 3️⃣ CV(Computer Vision) 서비스 비교
구분 Azure Computer Vision API GCP Vision API
이미지 태깅 이미지 설명, 태그, 카테고리 라벨 감지(Label Detection)
객체 탐지(Object) 영역 인식, 클래스 이름 제공 객체 위치·확률 정보 함께 제공
얼굴 인식(Face) 연령·감정·아이디 비식별 속성 추출 얼굴 랜드마크, 감정 분석(제한적)
OCR(Text) 텍스트 감지·번역·레거시 OCR 지원 텍스트 감지·문맥별 언어 검출
API 호출 방법 REST, SDK REST, Client Libraries
🔧 코드 스니펫: Azure Computer Vision (Python)
from azure.cognitiveservices.vision.computervision import ComputerVisionClient
from msrest.authentication import CognitiveServicesCredentials
cv_endpoint = "https://<YOUR_REGION>.api.cognitive.microsoft.com/"
cv_key = "<YOUR_KEY>"
cv_client = ComputerVisionClient(cv_endpoint, CognitiveServicesCredentials(cv_key))
image_url = "<IMAGE_URL>"
tags_result = cv_client.tag_image(image_url)
print("태그:", [tag.name for tag in tags_result.tags])
🔧 코드 스니펫: GCP Vision API (Python)
from google.cloud import vision
vision_client = vision.ImageAnnotatorClient()
img = vision.Image()
img.source.image_uri = "<IMAGE_URL>"
response = vision_client.label_detection(image=img)
labels = response.label_annotations
print("라벨:", [label.description for label in labels])
⸻
🔥 4️⃣ 활용 팁 & 추천 시나리오
• OCR→문서 인사이트:
• 청구서·계약서 파싱에는 Form Recognizer + Document AI 조합 추천
• 다국어 리뷰 분석:
• 글로벌 고객 피드백은 Azure Text Analytics 다국어 감정 분석 활용
• 실시간 이미지 모니터링:
• CCTV 분석·태깅에는 GCP Vision API 서버리스 배포와 Pub/Sub 연동
• 커스텀 모델이 필요할 때:
• 문서 구조가 복잡하면 Azure Form Recognizer 커스텀 모델,
• 이미 학습된 도메인 모델 원하면 GCP Document AI
⸻
🎉 마무리
OCR·NLP·CV 분야의 Azure와 GCP는
각 플랫폼의 철학과 강점을 고스란히 담고 있어요.
**“우리 조직의 시나리오”**에 따라
– 빠른 PoC vs 커스텀 튜닝
– 단순 API 호출 vs 복잡 문서 파싱
등을 고려해 적합한 서비스를 선택해보세요!
다음 포스트에서는 RPA 고도화: 에러 복구·셀프 모니터링 설계 편으로 찾아올게요~
행복한 AI 개발 되세요! 👋
'IT & Tech 정보' 카테고리의 다른 글
🚀 실무자를 위한 AI 도구 사용 가이드 & 핵심 코드 스니펫 (0) | 2025.05.25 |
---|---|
🚀 RPA 고도화: 에러 복구·셀프 모니터링 설계 (0) | 2025.05.25 |
AutoML 플랫폼: Vertex AI vs SageMaker 실전 데모 (0) | 2025.05.25 |
ChatGPT vs Claude vs Llama: 3대 언어모델 올가미 해부 (0) | 2025.05.25 |
AI 시대, 회사 업무 ‘비효율의 숙달화’ 탈출 (0) | 2025.05.25 |