一、Causal Effect Estimation

下述的内容给予假设的最基本的Causal Graph

其DAG关系如下

causality causality是几级词汇

,,(即Z为confounder)。

1、原生的并不能直接表示因果效应。

可以被解释为很多变量interaction的结果。其中一些是因果关系(causal),而另一些只是单纯的观察性关联(purely observational)。We can say that any statistically meaningful association is the result of a causal relationship somewhere in the system, but not necessarily of the causal effect of interest

2、定义因果效应。

定义:,如果我们外生地(exogenous)干涉X,能对Y造成影响,则这部分影响是我们关心的应果效应。这意味着我们必须在系统之外(outside the system)来改变X,从而影响Y。外生地改变X是为了避免系统其他变量带来的影响。

causality causality是几级词汇

3、如何得到:

4、得到泛化的Adjustment Formula:(即通过pre-intervention的概率分布,进行adjust,以获得causal effect)

,PA为X的父节点

即,找到X的父节点PA,然后conditioning on it,得到依赖PA的条件概率,再根据计算其加权平均即可。

所以,其本质就是考虑其Parents的不同,获得加权平均。由于直接计算P(Y|X)的话,未考虑其Parents,很可能得出相反的结论,在[4]中的例子也有讲述。

5、别的手段:通过Randomized获得Causal Effect

其实我们进行完全随机试验,就是通过实验设计本身,消除指向X的Z。即实验组对照组仅有X不同。其他都是相同的,相当于X不受系统中任意的其他变量定义。这本身就是种外生地(exogenous)地修改X的手段。

我们将上述的问题继续泛化一下。如果我们要通过Causal Graph得到,我们需要Conditioning on哪些变量?

Prediction: Predict Y after observing X= x

Causation: Predict Y after setting X= x.

根据上述结论Backdoor Criterion,我们可以得到正确估计的方法:

【1】

而在Prediction中:

【2】

注意与【1】与【2】的区别。(根据Backdoor-Criterion,明显这里Z与X不是独立的,所以两者不相等)

其实很多人考虑在现实生产中,在大数据覆盖了方方面面的情况下,我们是否已经可以对万物都建模,都用特征描述了,那Confounding是否存在,或者以什么方式存在?

这个问题其实非常简单,那就是unobserved feature。举个例子,我们的特征包含用户的历史浏览点击记录,我们有个没有观测到的特征,比如用户近期经济状况。很好理解,不仅影响了用户的点击行为,同时也影响了用户的历史反馈特征,而且,这样的特征通常我们都没有观察到,所以,我们的估计,潜在都存在Confounding Bias。(由于大部分系统是一个循环的生态系统,所以这些bias在某种程度也导致了推荐所谓的同质化,马太效应等等)

Feedback Loop Amplifies Biases[10]

Refer

[1] Causal Effect:

目录:

见:

见:

之前对bias有些粗浅的讨论: Causal Bias

[2]D-Seperation

见:

简略:

[4]Causal Effect定义Intervention

见:

简略:

[5]Backdoor Criterion

见:

简略:

[6] Causal Inference CMU

estimator的选择见2.1章节,在prediction中,bias and variance are not equally important.。优化loss function的时候,其实也同时优化了bias and variance。

[7]在小样本AB test中,我们可以用随机AA实验+分层显著性校验,校验每一个分层的是否有显著性差异。

interventional distribution:Identification of Conditional Interventional Distributions

[8]Nonparametric_regression

[Linear regression] is a restricted case of nonparametric regression where is assumed to be affine.

[9]Semiparametric_model

[10]

Feedback Loop and Bias Amplification in Recommender Systems

二、reson 和 cause 的区别

reson和 cause都有“原由”、“理由”的意思,它们之间具体的区别:

1、reason与cause作名词时都有“原因”和“理由”的意思。reason通常指产生某种行为或想法的推理上的理由,而cause通常指导致某一事件发生的起因。

cause n.起因,理由,指导致某事发生的行为、事件等。

例句:

Lack of physical exercise is the leading cause of obesity in young students.

缺乏体育锻炼是青少年学生肥胖的主要原因。

reason n.原因,理由,指某事发生的原因或做某事的正当理由,常后接介词 for及 why或 that引导的从句,作“理由”解时还可后接动词不定式。

例句:

She gave her reason for being late.

她说出了迟到的原因。

2、cause用于表示具有明显因果关系的原因。reason有时能与cause换用,但上下文必须有能够查得出的或可以解释得出的因果关系。

扩展资料:

cause

英[kɔːz]美[kɔːz]

n.原因;事业;目标

vt.引起;使遭受

短语:

Cause trouble寻衅滋事;闯祸;闹事;制造祸端

main cause主因;主要原因;原因主要;主体根源

major cause主要原因;重要事由;主要病因;重要原因

efficient cause动力因;直接原因;有效原因;有效原因说

例句:

Smoking is the biggest preventable cause of death and disease.

吸烟是造成不必要疾病和死亡的最大原因。

reason:

英[ˈriːzn]美[ˈriːzn]

n.理由;理性;动机

vi.推论;劝说

vt.说服;推论;辩论

短语:

Propellerheads Reason音乐工作站

with reason合理;有道理;合乎情况;有充分理由地

fault reason故障原因

real reason真正原因;真正的原因;丝诺耶

三、causality是几级词汇

causality是四级词汇。

causality

读音:英[kɔː'zæləti]、美[kɔː'zæləti]

释义:n.缘由;因果关系。

用法:

用作名词(n.)There is no causality between financial structure and real economy.金融结构和实体经济之间并不存在因果关系。

用作名词(n.)This paper uses Granger causality tests verify above conclusions.利用格兰杰因果关系检验证实了以上结论。

词汇搭配:

principle of causality因果律。

causality of automaton自动机的因果律。

law of causality因果律。

causality condition因果条件。

causality analysis因果分析。

近义词:

cause and effect因果。

connection联系。

interconnection互相连络。

causation因果关系。