시작하시겠어요?
컨텍스트 타겟팅을 기반으로 효과적인 머신러닝 기반 UA캠페인 운영하기
iOS 14의 IDFA 폐지로 인해 광고주는 성장이라는 동일한 목표 하에 경쟁력있는 CPI와 가치있는 사용자 확보를 위한 대체 비사용자 기반 타겟팅 솔루션을 찾는 데 어려움을 겪고 있습니다.
컨텍스트 타켓팅이 중앙무대를 차지함에 따라, 각 스토어 카테고리에서 쉽게 조작될 수 있는 정보 이외의 정보를 수집하기 위해, 당사는 앱 사이의 컨텍스트 ‘거리′를 측정함으로써 각 번들을 벡터로 표현하기 위해 단어 표현 방법이라 불리는 ELMo를 사용합니다. 이 계산된 거리는 다른 수백가지 특징 중의 하나로 당사의 예측 모델에 제공되며 당사의 비딩 로직에서 중요한 역할을 합니다.
이 방법의 효과를 보여드리기 위해 컨텍스트 거리 계산기를 제작하였습니다. 계산기를 사용하면 각 앱스토어 소개문 간의 정교한 비교를 통해 작동방식, 테마, 특징 등이 가장 유사한 앱을 알 수 있습니다.
| # | 앱 이름 | 확신도 |
|---|---|---|
| 1 | mockmockBillion Cash Slots-Casino Game | 100% 확신도 값 100% - 고 확신도 컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다. 확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다. |
| 2 | mockmockEon Slots Casino Vegas Game | 90% 확신도 값 90% - 고 확신도 컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다. 확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다. |
| 3 | mockmockCash Tornado Slots - Casino | 50% 확신도 값 50% - 중 확신도 컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다. 확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다. |
| 4 | mockmockSuper Vegas Slots Casino Games | 44% 확신도 값 44% - 중 확신도 컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다. 확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다. |
| 5 | mockmockVegas Nights Slots | 40% 확신도 값 40% - 중 확신도 컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다. 확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다. |
| 6 | mockmockTycoon Casino - Vegas Slots | 90% 확신도 값 90% - 고 확신도 컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다. 확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다. |
| 7 | mockmockWinning Slots Las Vegas Casino | 90% 확신도 값 90% - 고 확신도 컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다. 확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다. |
| 8 | mockmockCash Frenzy - Slots Casino | 60% 확신도 값 60% - 중 확신도 컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다. 확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다. |
| 9 | mockmockVegas Slots - 7Heart Casino | 10% 확신도 값 10% - 저 확신도 컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다. 확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다. |
| 10 | mockmockSlots Casino - Vegas Slot Machine Games | 90% 확신도 값 90% - 고 확신도 컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다. 확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다. |
확신도 값
100% - 고 확신도
컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.
확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.
확신도 값
90% - 고 확신도
컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.
확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.
확신도 값
50% - 중 확신도
컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.
확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.
확신도 값
44% - 중 확신도
컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.
확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.
확신도 값
40% - 중 확신도
컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.
확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.
확신도 값
90% - 고 확신도
컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.
확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.
확신도 값
90% - 고 확신도
컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.
확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.
확신도 값
60% - 중 확신도
컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.
확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.
확신도 값
10% - 저 확신도
컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.
확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.
확신도 값
90% - 고 확신도
컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.
확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.
| # | 앱 이름 | 확신도 |
|---|---|---|
| 11 | mockmockEpic Vegas Slots - Casino Game | 40% 확신도 값 40% - 중 확신도 컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다. 확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다. |
| 12 | mockmockSlots of Vegas | 90% 확신도 값 90% - 고 확신도 컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다. 확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다. |
| 13 | mockmockSlots: Vegas Casino Slot Games | 90% 확신도 값 90% - 고 확신도 컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다. 확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다. |
| 14 | mockmockVegas Casino & Slots: Slottist | 88% 확신도 값 88% - 고 확신도 컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다. 확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다. |
| 15 | mockmockLuckyBomb Casino Slots | 90% 확신도 값 90% - 고 확신도 컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다. 확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다. |
| 16 | mockmockSlots Mega Win Casino Game | 75% 확신도 값 75% - 중-고 확신도 컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다. 확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다. |
| 17 | mockmockHigh 5 Casino: Home of Slots | 90% 확신도 값 90% - 고 확신도 컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다. 확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다. |
| 18 | mockmockWinner Slots Casino Games | 20% 확신도 값 20% - 저 확신도 컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다. 확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다. |
| 19 | mockmockCash Tap Casino: Slot Machines | 90% 확신도 값 90% - 고 확신도 컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다. 확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다. |
| 20 | mockmockCash Tap Casino: Slot Machines | 90% 확신도 값 90% - 고 확신도 컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다. 확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다. |
확신도 값
40% - 중 확신도
컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.
확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.
확신도 값
90% - 고 확신도
컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.
확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.
확신도 값
90% - 고 확신도
컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.
확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.
확신도 값
88% - 고 확신도
컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.
확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.
확신도 값
90% - 고 확신도
컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.
확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.
확신도 값
75% - 중-고 확신도
컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.
확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.
확신도 값
90% - 고 확신도
컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.
확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.
확신도 값
20% - 저 확신도
컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.
확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.
확신도 값
90% - 고 확신도
컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.
확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.
확신도 값
90% - 고 확신도
컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.
확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.
번들 ID를 입력하고 '계산'을 클릭하면 컨텍스트가 가장 유사한 앱을 볼 수 있습니다.
설치 및 구매 예측 모델을 위한 컨텍스트 유사 기능을 개발할 때 두 가지 주요 원칙을 고려했습니다: 첫째, 컨텍스트는 사용자 행동 및 광고 참여를 예측하는 데 중요한 역할을 하고, 둘째, 컨텍스트는 상당히 미묘한 차이가 있을 수 있습니다.
이 개념은 내재된 편견을 포함하고 경우에 따라 ASO 문제로 인한 노골적인 부정확성 및 주제 모델링 방법(예: LDA나 W2V)을 사용하여 클러스터링하는 직접 카테고리를 만드는 것과 같은 다른 접근 방식을 포함하므로 스토어 카테고리 사용을 무의미하게 만들며 우리가 목표로 한 정보 획득과 정확성 향상을 생성하고, 우리는 각각의 모든 번들을 개별적으로 표현할 방법을 찾아야 한다는 것을 깨달았습니다.
기계 학습의 언어 관련 문제를 해결하는 데 일반적으로 사용되는 작업의 복잡성과 도구를 평가한 후, 당사 데이터 사이언티스트의 연구를 통해 ELMo를 테스트하는 것으로 결론지었습니다. ELMo는 55억 개의 방대한 토큰(단어 및 구성 부분) 데이터 세트 내에서 사용되는 구문을 학습함으로써 서로 다른 컨텍스트를 사용할 때 단어와 의미 간의 연관성을 학습하기 위해 신경망을 사용합니다.
ELMo 모델이 학습된 후 각 단어를 벡터로 표현하여 의미체계의 레벨과 구문간의 유사성을 알려주는 각 단어 사이의 코사인 거리를 측정할 수 있습니다. 각 단어는 컨텍스트를 이해하는 것이 매우 중요하므로, ELMo는 복잡한 작업을 위한 가장 신뢰할 수 있는 방법이라는 것이 입증되었습니다.
유사성 거리에 의해 효과적으로 측정되는 동안 단어 벡터가 컨텍스트 상황에 따라 얼마나 가까운지에 대한 예시
단어의 가중합에서 번들 벡터가 생성되는 모습
단어 벡터를 생성한 후 다음 단계는 컨텍스트를 효과적으로 표현하는 방식으로 각 번들에 대해 단어벡터를 합하는 것입니다. 표면적으로는 앱스토어 소개문 전체를 단일 벡터 표현에 포함하여 서로 다른 앱 간의 컨텍스트 '거리'를 측정할 수 있습니다.
당사 연구 개발 과정에서 이 단계가 가장 난해한 것으로 밝혀졌습니다. 앱스토어 소개문에 있는 모든 단어의 벡터를 평균화하는 것만으로도 충분해 보이지만 특정 앱의 스토어 소개문 및 전체 말뭉치 내에서 특정 단어가 나타나거나 반복되는 빈도와 관련된 귀중한 데이터를 잃어 버리게 됩니다.
많은 테스트 후 가장 많은 정보를 얻을 수 있는 접근 방식은 NLP(자연어처리, 텍스트 분석에 중점을 둔 기계 학습의 한 분야) -TFIDF-Term Frequency Inverse (to) Document 빈도 : 기본적으로 말뭉치 내 특정 단어의 희소성을 나타냄 - 의 주요 수치 통계를 기반임을 발견했습니다.
따라서, 번들 표현은 각 앱의 고유 테마, 작동방식 및 기능을 일반적으로 표현하는 더 희귀하고 미묘한 단어에 중점을 두기 위해 각 단어 벡터의 가중 평균에 TFIDF값을 곱하여 매우 세분화되어 있지만 가치있는 정보를 제공하는 모델로 발전하였습니다.
컨텍스트 타겟팅을 기반으로 효과적인 머신러닝 기반 UA캠페인 운영하기