Data Science Toolkit - Bonsai 言語
Bonsai 言語は、カスタム予測モデルのデシジョン ツリー ロジックを記述するように設計されています。 このページでは、Bonsai 言語の構文とコア セマンティクスについて説明します。 追加のリファレンスとして、Backus-Naur フォーム表記法の完全な文法も提供しました。
式
Bonsai で記述されたデシジョン ツリーは、 branch
または if/elif/else
や switch
式として書かれた一連の分岐として構成されます。
branch
の結果は、leaf
またはleaf value
と呼ばれます。
leaf value
を受け取る変数は、使用されているカスタム モデルによって異なります。 たとえば、カスタム モデルの種類が bid
のmodel_outputでカスタム モデルを使用した場合、leaf
はカスタム モデルを使用して の CPM 入札価格に適用されます。
注:
負またはゼロ (0) の入札は、機能の説明で明示的に指定しない限りサポートされません。 これらの式を使用しないか、予期しない結果が発生する可能性があります。 Bonsai Smart Leaves を使用してno_bidを明示的に指定することをお勧めします。
If/Elif/Else
すべての if
には、一致する else
が必要です。
if
と一致するelse
の間には、0 個以上のelif
式を指定できます。
例
if country = "US":
1
elif user_hour range (8, 12):
if domain = "news.com":
0.85
else:
0.2
else:
0.1
この例では、入れ子になったif/else
式を持つif/elif/else
式を示します。 この例の決定パスは次のとおりです。
- ユーザーは米国に存在しますか?
- はいの場合は、1 を入札します。
- いいえの場合は、手順 2 に進みます。
- ユーザーのタイムゾーンの午前 8 時から午後 12 時の間ですか?
- はいの場合は、手順 3 に進みます。
- いいえの場合は、0.1 に入札します。
- ドメインは "news.com" ですか?
- はいの場合は、0.85 に入札します。
- いいえの場合は、0.2 に入札します。
スイッチ
switch
式は、多数のチェーンされたif/elif
ステートメントの代替として使用できます。 これは、1 つの機能についてテストする値が多数ある場合に便利です。
switch
式に関する注意事項:
- 各ケースは、キーワード
case
で始まる必要があります。 - ケースには、1 つの値、値の一覧、または範囲を指定できます。 範囲は数値にのみ使用できます。
- 各ケースの値、値の一覧、または値の範囲は、かっこで囲む必要があります。
- 範囲は、2 つのピリオド (
..
) で示されます。 範囲は、1 つまたは 2 つの境界で使用できます。 境界は包括的です。 たとえば、( .. 3)
は、3 まで番号付けされたすべてのケースに適用されます。 - 大文字と小文字を区別すると、リーフまたは別の式が発生する可能性があります。
-
switch
式は、default
ケースで終了する必要があります。 これにより、ツリーのすべてのリーフに値が設定されます。
例
switch user_hour:
case (1 .. 3):
0.4
case (4, 6, 8):
if country present:
0.8
else:
0.4
default: 0.1
この例の決定パスは次のとおりです。
- ユーザーのタイムゾーンは午前 1 時から午前 3 時の間ですか?
- はいの場合は、0.4 に入札します。
- いいえの場合は、手順 2 に進みます。
- ユーザーのタイムゾーンの午前 4 時、6 時、または午前 8 時ですか?
- はいの場合は、手順 3 に進みます。
- いいえの場合は、0.1 に入札します。
- 国は存在しますか?
- はいの場合は、0.8 に入札します。
- いいえの場合は、0.4 に入札します。
条件
if
ステートメントと elif
ステートメントでは、any
条件とevery
条件を使用して、ブール値ロジックを一連の機能に適用できます。
注:
単一のif
ステートメントまたはelif
ステートメントでany
条件とevery
条件を組み合わせうことはできません。
任意
if
または elif
ステートメントでany
条件を使用する場合、特徴値間のコンマ区切り記号は実質的に "ors" になります。 つまり、ステートメント内 のいずれかの 機能が印象と一致する場合、リーフが評価されます。
この例では、時間が存在する OR 国が OR で、日曜日、月曜日、または火曜日の場合、 1
リーフが評価されます。
if any user_hour present, country present, user_day < 4:
1
else:
0.2
毎
if
または elif
ステートメントでevery
条件を使用すると、特徴値間のコンマ区切り記号は実質的に "ands" になります。 つまり、ステートメント 内のすべての 機能が印象と一致すると、リーフが評価されます。
この例では、時間が存在し、国が AND で、日曜日、月曜日、または火曜日である場合、 1
リーフが評価されます。
機能
Bonsai の中心的な構文要素が 特徴です。 機能は、次で構成されます。
- キーワード
- 有効な値のセット
次の例では、feature キーワードは user_day
で、有効な値は 0
-6
間の整数です。ここで、 0
は日曜日、 6
は土曜日です。
if user_day < 6:
1
else:
2
feature キーワードに無効な値を使用すると、API は、デシジョン ツリーの問題の正確な場所と性質を示すエラーを返します。
if user_day < 100:
1
else:
2
ERROR: Invalid value on line 1 at position 13; user_day must be between 0 and 6
Bonsai 検証の詳細については、「 デシジョン ツリーの検証とエラー メッセージ」を参照してください。
使用可能な機能とその有効な値の完全な一覧については、「 Bonsai 機能」を参照してください。 一部の特徴は数値 ( user_hour
など) ですが、他の特徴は ( country
など) ではないことに注意してください。 特定の数値演算子は、数値型に対してのみ有効です。
注:
segment
機能は、他のすべての機能とは異なる方法で処理されます。 これは、次に基づいてのみテストできます。
- セグメントプレゼンス
- ユーザーがセグメントに追加されてからの分数
- セグメントと共に渡されるユーザー定義値
詳細については、「 Bonsai 特徴のセグメントプレゼンス、セグメント年齢、セグメント値」を参照してください。
演算子
プレゼンス/不在
present
演算子とabsent
演算子は、機能の有無をテストするために使用されます。
if country present:
2
else:
1
比較
次の比較演算子がサポートされています。
オペレーター | 意味 |
---|---|
= |
等しい |
!= |
等しくない |
/= |
等しくない |
< |
より小さい (整数でのみ使用できます) |
> |
より大きい (整数でのみ使用できます) |
<= |
以下 (整数でのみ使用できます) |
>= |
以上 (整数でのみ使用できます) |
if country = "US":
2
else:
1
In
in
演算子は、特徴値が使用可能な値の一覧内の任意の値と一致するかどうかをテストするために使用されます。 リストはかっこで囲む必要があることに注意してください。
if country in ("US", "MX", "CA"):
2
else:
1
範囲
range
演算子は、包括的な値範囲のメンバーシップの特徴値をテストするために使用されます。
この演算子は整数値でのみ使用できます。
整数範囲はかっこで囲む必要があります。
if user_hour range (1, 12): 1 else: 0.2
上記の例では、時間がユーザーのタイム ゾーンの午前 1 時から午後 12 時の間にあるかどうかをテストします。
注:
範囲を使用してスイッチ式のケースを指定する場合は、コンマではなく、範囲内の 2 つのピリオド (..
) を使用します。 詳細については、「 スイッチ」を参照してください。
未サポート
not
キーワードは、条件を否定するために使用されます。
if not country present:
1
else:
0.2
葉
すべてのツリーブランチはリーフ値につながります。
- 各リーフには、整数または浮動小数点数を指定できます。
-
"bid"
model_output
を使用したカスタム モデルの場合:- 各リーフは、カスタム モデルを使用する の通貨での cpm 入札価格です。
-
"bid_modifier"
model_output
を使用したカスタム モデルの場合:- 各リーフは、Xandr 最適化派生 CPM 入札に適用される乗数です。
次の "bid"
model_output
例では、 でを USD で使用すると、葉の入札値は $1.00 CPM と $0.25 CPM になります。
if not country present:
1
else:
0.25
スマート リーフ
スマート リーフでは、広告のパフォーマンスと配信に関する推定指標に基づいて、入札単価が動的に変更されます。
- スマート リーフは、
"bid"
と"bid_modifier" model_output
の両方をサポートします。 - スマートリーフを使用すると、
"no_bid"
値を指定できます。 - スマートリーフを使用すると、
leaf_name
フィールドでリーフに名前を付けできます。 - 入札値は、次の情報から取得できます。
- 推定 IAB ビュースルー 率
- 推定平均価格
- 見積もりクリア価格
- 一様乱数
次の例では、入札価格は推定平均価格に 1.5 を掛け、オフセットは $0.03 で、最小値は $1、最大値は $5 です。
if country = "US":
leaf_name: "10000"
value: compute(estimated_average_price, 1.50, 0.03, 1.00, 5.00)
詳細については、「 Bonsai Smart Leaves」を参照してください。
圧入
タブ文字 (\t
) は、行のインデントを示すために使用されます。これは、式のグループ化 (Python と同様) を決定するために使用されます。 現時点では、タブのみがサポートされています (スペースは無視されます)。 改行文字 (\n
) は、行の末尾をマークするために使用されます。
注釈
#
文字はコメント用です。 コメントは、Bonsai がコードとして実行しようとしないテキスト行です。 人間が読むだけです。
コメントを使用すると、コードの理解が容易になります。 コードを振り返ったり、他のユーザーが共同作業を行いたい場合は、コメントを読んで、コードの動作を簡単に把握できます。
各コメントは、独自の行にあり、
#
文字で始まる必要があります。複数行のコメントを記述する場合、各行は
#
文字で始まる必要があります。現時点では、他の Bonsai コードと同じ行にコメントを挿入することはできません。
有効なコメント
# Evaluate if hour is between 1am and 12pm in the user's time zone. If so, bid $1.00. If not, bid $0.20. if user_hour range (1, 12): 1 else: 0.2
有効なコメント
# Evaluate if hour is between 1am and 12pm in the user's time zone. # If so, bid $1.00. If not, bid $0.20. if user_hour range (1, 12): 1 else: 0.2
無効なコメント
if user_hour range (1, 12): # Evaluate if hour is between 1am and 12pm in the user's time zone. if so, bid $1.00. If not, bid $0.20. 1 else: 0.2
完全な文法
この完全な文法は、Backus-Naur フォーム表記です。
ソースの展開
expression : ifExpression
| switchExpression
| leaf
;
ifExpression : 'if' condition consequent alternative
;
condition : anyCondition
| everyCondition
| notCondition
| segmentCondition
| scalarCondition
;
conditionList : simpleCondition
| simpleCondition ',' conditionList
;
simpleCondition : simpleNotCondition
| segmentCondition
| scalarCondition
;
simpleNotCondition : 'not' simpleCondition
;
anyCondition : 'any' conditionList
;
everyCondition : 'every' conditionList
;
notCondition : 'not' condition
;
segmentCondition : 'segment' INT segmentSubconditionList
| 'segment' INT
;
segmentSubconditionList : segmentSubcondition segmentSubconditionList
| segmentSubcondition
;
segmentSubcondition : age < INT
| age > INT
| value < INT
| value > INT
;
scalarCondition : feature_keyword 'present'
| feature_keyword 'absent'
| feature_keyword 'in' valueList
| feature_keyword '=' value
| feature_keyword '>' value
| feature_keyword '<' value
| feature_keyword '/=' value
| feature_keyword 'range' '(' value ',' value ')'
;
valueList : value
| '(' value ',' valueList ')'
;
value | determind by feature;
feature_keyword : 'country'
|'region'
|'city'
|'value'
|'cookie_age'
|'user_hour'
|'size'
|'user_day'
|'os_family'
|'os_extended'
|'browser'
|'language'
|'domain'
|'position'
|'placement'
|'placement_group'
|'publisher'
|'seller_member_id'
|'mobile_app'
|'advertiser_day_freq'
|'advertiser_life_freq'
|'advertiser_recency'
|'supply_type'
|'carrier'
|'device_type'
|'device_model'
|'zip'
|'user_gender'
|'dma'
;
consequent : ':' INDENT expression DEINDENT
;
alternative : 'elif' condition consequent alternative
| 'else' ':' INDENT expression DEINDENT
switchExpression : 'switch' feature_keyword ':' INDENT caseList DEINDENT
;
caseList : case caseList
| default
;
case : 'case' valueList ':' INDENT expression DEINDENT
default : 'default' ':' INDENT expression DEINDENT
leaf : INT
| FLOAT
| smartLeaf
;
smartLeaf : keyVal smartLeaf
| keyVal
;
kevVal : value
| learn
| name
;
value : 'value' ':' valueVals
;
learn : 'is_learn' ':' BOOL
;
name : 'leaf_name' ':' ID
;
valueVals : computeLeaf
| 'no_bid'
| numeric
;
computeLeaf : 'compute' '(' inputField ',' computeVal ',' computeVal ',' computeVal ',' computeVal ')''
inputField : 'estimated_iab_viewthrough_rate'
| 'estimated_video_completion_rate'
| 'estimated_average_price'
| 'estimated_clearing_price'
| 'estimated_click_rate'
| 'uniform'
;
computeVal : numeric
| '_'
;
numeric : INT
| FLOAT
;