TROCCO 웹 행동 로그 수집 SDK - 기술 사양
    • PDF

    TROCCO 웹 행동 로그 수집 SDK - 기술 사양

    • PDF

    기사 요약

    개요

    이 페이지에서는 다음 사항에 대해 설명합니다.

    작동 환경

    TROCCO 웹 행동 로그 수집 SDK는 다음과 같은 환경에서 수행된 로그가 수집되는 것을 확인했습니다.

    검증된 버전에 대한 정보

    아래 나열된 버전은 모두 메이저 버전입니다.
    TROCCO 웹 행동 로그 수집 SDK는 해당 메이저 버전 내에서 임의의 마이너 버전에 대한 동작을 확인합니다.
    마이너 버전을 포함한 모든 버전에 대해 동작 확인이 완료된 것은 아님을 알려드립니다.

    OS

    • Windows 10 이상
    • macOS 10 이상
    • 안드로이드 7 이상
    • iOS 12 이상

    웹 브라우저

    • Microsoft Edge 42 이상
    • Google Chrome 72 이상
    • Safari 12 이상
    • Mozilla Firefox 65 이상
    Safari에서 Back Forward Cache의 영향

    TROCCO 웹 행동 로그 수집 SDK에서는 브라우저 백 시에도 PageView가 측정됩니다.
    단, TROCCO 웹 행동 로그 수집 SDK 배포 대상 사이트의 HTTP 응답에서 Cache-Control: . no-storecache-control: no-store 및 no-cache가 부여되지 않은 경우, Safari(iOS/macOS)의 Back Forward Cache의 영향으로 PageView가 측정되지 않습니다.

    본 사안은 TROCCO 웹 행동 로그 수집 SDK 측에서는 대응할 수 없습니다.
    따라서 사이트 측의 설정 변경을 통해 대응하시거나 자바스크립트를 사용하여 강제적으로 화면을 다시 불러오도록 설정해 주시기 바랍니다.
    (참고: https://qiita.com/shibe23/items/79f950061457ff1a7687#%E5%AF%BE%E7%AD%96)

    세션의 정의

    세션이란?

    사용자가 사이트를 방문한 후 이탈하기까지의 일련의 흐름을 정리한 개념입니다.
    구글 애널리틱스에서 말하는 세션/방문과 동의어입니다.

    이 항목에서는 주로 세션 종료 조건에 대해 설명합니다.
    세션 종료 조건은 크게 두 가지로 나뉜다.

    • 시간별 종료
    • 캠페인 전환에 따른 종료

    시간별 종료

    아래에서는 편의상 세션 타임아웃 시간을 기본값인 30분으로 설명합니다.
    세션 타임아웃 시간을 변경하려면 기존 설정 변경 에서 session_expire_msec을 변경하면 된다.

    구글 애널리틱스와의 사양 차이

    TROCCO 웹 행동 로그 수집 SDK는 구글 애널리틱스와 달리 '하루가 지나면 만료'라는 개념이 존재하지 않습니다.

    무작동 시간으로 인한 종료

    마지막 PageView 이후 30분 동안 조작하지 않으면 세션이 종료됩니다.
    30분 이상 경과 후 새로운 PageView가 발생하면 해당 PageView는 새로운 세션에 연결됩니다.

    이벤트에 의한 지속성

    마지막 PageView 이후 30분이 경과하기 전에 이벤트가 발생하면, 그 전까지 카운트되던 타임아웃 시간이 한 번 초기화됩니다.
    즉, 직전 이벤트에서 30분 동안 조작하지 않으면 해당 세션이 종료됩니다.
    따라서 발생 간격이 30분 이상 떨어져 있는 두 개의 PageView가 있을 때 동일한 세션으로 취급될 수 있습니다.

    이벤트에 의한 PageView 자동 전송

    이전 PageView 또는 이벤트 이후 30분 이상 조작하지 않은 상태에서 새로운 이벤트가 발생하면 PageView도 함께 가져옵니다.

    캠페인 전환에 따른 종료

    세션은 다른 페이지의 유입에 따라 전환될 수 있습니다.

    image.png

    캠페인 매개변수에 따른 판단

    아래에서 정한 캠페인 파라미터가 현재 페이지의 URL에 설정되어 있는 경우, 캠페인 파라미터에 따라 세션 전환 여부가 판단됩니다.
    예를 들어, 자체적으로 설정한 UTM 매개변수, 광고 매개변수 등이 캠페인 매개변수에 해당한다.
    현재 페이지에 캠페인 매개변수가 있는 경우, 유입 시 캠페인 매개변수와 모두 일치하는 경우 세션이 지속됩니다.

    캠페인 매개변수 정의

    TROCCO 웹 행동 로그 수집 SDK는 다음과 같은 파라미터를 캠페인 파라미터로 인식합니다.
    - UTM 매개변수

    • utm_source
    • utm_medium
    • utm_campaign
    • utm_content
    • utm_term
      - 광고 매개 변수
    • AdWords
    • gclid

    추천인에 의한 판단

    페이지뷰가 발생할 때마다 리퍼러에 의한 세션 전환 판단이 이루어집니다.

    이 때 먼저 리퍼러 URL과****세션 시작 시점의 유입 URL을 비교합니다.
    이 URL이 일치하는 경우, 동일한 사이트 내 전환으로 간주되어 세션이 계속 유지됩니다.

    위의 URL이 다른 경우, 리퍼러 URL의 호스트와****현재 페이지 URL의 호스트가 비교됩니다.
    호스트가 다를 경우 기본적으로 다른 사이트에서 유입된 것으로 간주하여 세션이 전환됩니다.

    각 용어의 정의

    다음은 각 용어의 정의입니다.
    - 리퍼러 URL
    - JavaScript의 document.referer에서 가져오는 URL입니다.
    - 세션 시작 시 유입 URL
    - 세션 시작이 캠페인 파라미터에 의한 경우, 세션이 시작된 PageView의 현재 페이지 URL이 됩니다.
    - 그렇지 않은 경우, 세션이 시작된 PageView의 리퍼러 URL이 됩니다.
    - 현재 페이지 URL
    - JavaScript의 location.href 에서 가져온 URL입니다.
    - 호스트
    - RFC에서 정한 URL의 호스트 부분입니다.
    - 예를 들어, https://your-site.com:8080/page/pathというURLの場合,``your-site.com이 호스트입니다.

    다음은 리퍼러에 의한 세션 전환 판단의 예시입니다.
    리퍼러 URL 호스트인 yahoo.co.jp와 세션 시작 시 URL 호스트인 www.google.comは異なるため, 세션이 전환됩니다.

    열람순서세션현재 페이지 URL리퍼러 URL세션 시작 시 URL 호스트
    1세션 Ahttps://n-analytics.com/lp/index.htmlhttps://www.google.comwww.google.com
    2세션 Ahttps://n-analytics.com/https://n-analytics.com/lp/index.htmlwww.google.com
    3세션 Bhttps://n-analytics.com/lp/index.htmlhttps://yahoo.co.jphttps://yahoo.co.jp

    채널의 정의

    채널이란?

    유입 경로를 식별하는 라벨입니다.
    세션 시작 시 리퍼러와 랜딩페이지 URL을 통해 판단되며, 세션 내 모든 PageView에서 동일한 값을 유지합니다.
    채널은 다음과 같은 5가지 개념으로 구성되어 있으며, 계층적 구조로 되어 있습니다.

    channel_group > medium > source > campaign > keyword

    채널 유형설명값 예시
    channel_groupGoogle Analytics의 '채널 그룹'에 해당하는 값입니다.
    채널의 최상위 개념으로, 인간이 인지하기 쉬운 형태로 채널을 분류한 것이다.
    MEDIUM 값에 따라 모두 자동으로 그룹화됩니다.
    그룹화 조건은 아래 정의 목록을 참고하세요.
    오가닉 검색, 유료 검색, 소셜
    mediumUTM 매개변수 utm_medium 또는 자동 부여됩니다.오가닉, CPC, 소셜
    sourceUTM 매개변수 utm_source 또는 자동 부여됩니다.구글, 야후, 페이스북
    캠페인UTM 매개변수 utm_campaign이 있으면 그 값이 저장됩니다.----------------------------------------------------------------------------------------------.
    키워드UTM 매개변수 utm_term 또는 검색계 채널의 경우 자동으로 부여됩니다.----------------------------------------------------------------------------------------------.

    채널은 크게 두 가지로 나뉜다.
    - UTM 매개변수에 따른 채널
    - 자동 부여되는 채널

    UTM 매개변수에 따른 채널

    랜딩페이지에 UTM 파라미터를 부여한 경우, 원하는 채널을 설정할 수 있습니다.
    예를 들어 https://your-site.com?utm_medium=Foo&utm_source=Bar&utm_campaign=hogeというURLでランディングした場合,
    각 채널의 값은 다음과 같습니다.

    • medium: Foo
    • source: Bar
    • campaign: hoge
    • keyword: NULL

    자동 부여되는 채널

    유명 SNS나 검색 사이트 등에서는 자동으로 채널이 식별됩니다.
    정의 목록 부여 방식이 '자동'으로 설정된 채널만 해당됩니다.
    또한, 자동 부여 대상 전환에서도 UTM 매개변수가 있는 경우 해당 매개변수가 우선합니다.

    채널 정의 목록

    아래 csv 파일을 참고하세요.
    (Embed)(https://cdn.document360.io/3a3bae1e-f157-487f-8798-01e9d820e760/Images/Documentation/n_analytics_channel_definition.csv)

    로그 수집 및 로그 파일에 대한 정보

    TROCCO 웹 행동 로그 수집 SDK로 수집한 로그는 다음 조건을 충족하는 시점에 당사가 관리하는 Amazon S3에 저장됩니다.

    • 마지막 저장 후 5분이 경과한 시점
    • 수집한 파일 크기가 256MB에 도달한 경우

    또한, TROCCO 웹 행동 로그 수집 SDK의 API 서버는 부하 분산 및 이중화를 위해 여러 대의 서버를 상시 가동하고 있습니다. (서버 대수는 비공개)
    따라서 한 번의 저장 타이밍에 서버 대수만큼의 파일이 생성된다.
    각 파일 내의 행 수는 보장할 수 없지만, 대략 균등하게 분할됩니다.

    또한, 특정 시점에 수집 대상 로그 파일의 총 크기가 '서버 대수×256MB'를 초과하는 경우, 먼저 '서버 대수×256MB'만큼의 로그 파일이 저장됩니다.
    해당 타이밍에 저장되지 않은 나머지 로그 파일은 다음 타이밍(5분 후)에 저장됩니다.

    Single Page Application에서 페이지 전환 시 페이지뷰를 추적하는 방법

    페이지 전환 시점에 자바스크립트 코드 삽입 에서 설명한 아래 코드 부분이 실행되도록 웹사이트 측 자바스크립트에 처리를 추가해 주세요.

    Nanalytics('setup','<site_id>',(new Date).getTime());
    Nanalytics('send','pageview');
    

    이 문서가 도움이 되었습니까?