本节包含对ECMAScript语言非规范性的概述。
ECMAScript是一种在宿主环境中执行计算并处理计算对象的面向对象编程语言。这里的ECMAScript 并不是计算性自完备的;事实上,本规范并没有规定外部数据输入和计算结果输出。相反,我们期望ECMAScript程序的计算环境不仅提供本规范中描述的对象和其他设施,还能提供某些特定环境下的宿主对象;除非为了说明宿主对象可能提供某些属性和方法以供ECMAScript程序访问,这些宿主对象描述和行为都超出了本规范的范围。
脚本语言是一种用于操作、自定义、自动化现有系统设施的编程语言。在这种系统中,用户已经可以通过一个用户界面使用可用功能,脚本语言正是暴露这些有用功能给程序控制的一种机制。这样,现有系统可以说是提供了对象和设施的一种宿主环境,以完善脚本语言能力。因此,设计脚本语言时,就考虑到了可被专业和非专业程序员都能使用。
ECMAScript最初被设计为Web脚本语言,提供一种机制,使浏览器中的网页更加活跃,使基于Web的客户端/服务器架构能够执行服务器计算。ECMAScript 可以为各种宿主环境提供核心的脚本功能,因此本文档为不依赖特定宿主环境的核心脚本语言作出规范。
ECMAScript的一些机能和其他编程语言的类似;特别是下列文献所描述的Java?、Self和Scheme:
- Gosling, James, Bill Joy and Guy Steele. The Java? Language Specification. Addison Wesley Publishing Co., 1996.
- Ungar, David, and Smith, Randall B. Self: The Power of Simplicity. OOPSLA '87 Conference Proceedings, pp. 227–241, Orlando, FL, October 1987.
- IEEE Standard for the Scheme Programming Language. IEEE Std 1178-1990.
WEB 浏览器为了增加客户端的计算能力而引入 ECMAScript 宿主环境,例如,它提供的对象有:windows,menus,pop-ups,dialog boxes,text areas,anchors,frames,history,cookies 及输入 / 输出等等。进一步来说,WEB 浏览器中提供的这种宿主环境可以让脚本代码处理诸如改变焦点、页面和图片的加载、卸载、错误和放弃,选择,表单提交和鼠标交互等等事件。脚本代码出现在 HTML 中,显示出来的页面则是一个由用户接口元素、已确定计算出来的文本以及图片的集合。脚本代码根据用户的交互而做出反应,并不需要存在一个主程序。
WEB 服务器为了服务端的计算提供了完全不一样的宿主环境,包括的对象有:requrests,clients,files 以及数据锁定和分享机制。通过浏览器端脚本及服务端脚本的配合使用,在为基于 WEB 方式的应用程序提供可定制的用户接口的同时时,也将计算分布到客户端和服务端进行。
每一种支持 ECMAScript 的 WEB 浏览器和服务器都将它们自身的宿主环境作为 ECMAScript 的补充,以使得 ECMAScript 的执行环境变得完整。
下面是非正式的 ECMAScript 概述 —— 并未描述语言的所有部分。此概述并非标准的一部分。
ECMAScript 是基于对象的:基本语言和宿主设施都由对象提供,ECMAScript 程序是一组可通信的对象。ECMAScript 对象是属性的集合,每个属性有零个或多个 特性,以及属性的使用方式。例如,当设置一个属性的Writable 特性为 false 时,任何试图更改此属性值的 ECMAScript 代码的都会执行失败。属性是一个容器,它可以存放其他 对象、原始值、函数。原始值是以下内置类型之一的成员:Undefined、Null、Boolean、Number、String;对象是剩下的内置类型 Object 的成员;函数是可调用的对象。方法是通过属性与对象关联的函数。
ECMAScript 定义了一组内置对象,完善了 ECMAScript 实体的定义。这些内置对象包括 全局对象、Object对象、Function对象、Array对象、String对象、Boolean对象、Number对象、Math对象、Date对象、RegExp对象、JSON对象 和 Error对象: Error、EvalError、RangeError、ReferenceError、SyntaxError、TypeError、URIError。
ECMAScript 中还定义一组内置运算符。ECMAScript 运算符包括 一元运算符、乘法运算符、加法运算符、位移运算符、关系运算符、等值运算符、二元按位运算符、二元逻辑运算符、赋值运算符、逗号运算符。
ECMAScript 语法有意设计成与 Java 语法类似。ECMAScript 的语法是松散的,使其能够作为一个易于使用的脚本语言。例如,一个变量不需要有类型声明,属性也不需要与类型关联,定义的函数也不需要声明在函数调用语句的前面。
ECMAScript 不使用诸如 C++、Smalltalk、Java 中的类。相反,对象可以通过各种方式创建,包括字面量符号、构造器 创建对象然后运行代码初始化其全部或部分属性值,并为这些属性分配初始值。每个构造器是一个拥有名为“prototype”属性的函数。此属性用于实现 原型继承 和 属性共享。构造器通过 new 表达式创建对象:例如,new Date(2009,11) 创建一个新 Date 对象。不使用 new 调用一个构造器的结果,依赖构造器本身。例如,Date() 产生一个表示当前日期时间的字符串,而不是一个对象。
每个由构造器创建的对象都有一个隐式引用(叫做对象的原型)链接到构造器的“prototype”属性值 。再者,原型可能有一个非空隐式引用链接到它自己的原型,以此类推,这叫做 原型链。当一个引用被连接到对象的属性上时,引用会指向原型链中包含此属性名的第一个对象对应的属性。换句话说,首先检查对象直接的同名属性,如果对象包含同名的属性,引用即指向此属性,如果该对象不包含同名的属性,则下一步检查对象的原型,以此类推。
通常在基于类的面向对象语言中,实例拥有状态,类拥有方法,并且只能继承结构和行为。在 ECMAScript 中,对象拥有状态和方法,并且结构,行为,状态全都可继承。
所有不直接包含原型中包含的特定属性的对象会共享此属性及属性值。图1 说明了这一点:
http://ecma-international.org/ecma-262/5.1/figure-1.svg 图1 — 对象与原型的关系图
<var>CF</var> 是一个构造器(也是一个对象)。五个对象已用 new 表达式创建 : <var>cf<sub>1</sub></var>、<var>cf<sub>2</sub></var>、<var>cf<sub>3</sub></var>、<var>cf<sub>4</sub></var>、<var>cf<sub>5</sub></var>。每个对象都有名为 <var>q1</var> 和 <var>q2</var> 的属性。虚线表示隐式原型关系;例如:<var>cf<sub>3</sub></var> 的原型是 <var>CF<sub>p</sub></var>。构造器 <var>CF</var> 自己有名为 <var>P1</var> 和 <var>P2</var> 的两个属性,这对 <var>CF<sub>p</sub></var>、<var>cf<sub>1</sub></var>、<var>cf<sub>2</sub></var>、<var>cf<sub>3</sub></var>、<var>cf<sub>4</sub></var>、<var>cf<sub>5</sub></var> 是不可见的。<var>CF<sub>p</sub></var> 中名为 <var>CFP1</var> 的属性和任何在 <var>CF<sub>p</sub></var> 的隐式原型链中能找到且不名为 <var>q1</var>、<var>q2</var>、<var>CFP1</var> 的属性都被 <var>cf<sub>1</sub></var>、<var>cf<sub>2</sub></var>、<var>cf<sub>3</sub></var>、<var>cf<sub>4</sub></var>、<var>cf<sub>5</sub></var> 所共享(但不被 <var>CF</var> 共享)。请注意 <var>CF</var> 和 <var>CF<sub>p</sub></var> 之间没有隐式原型链接。
不同于基于类的对象语言,属性可以通过赋值的方式动态添加给对象。也就是说,构造器并不是非要对构造的对象的全部或任何属性命名或赋值。上图中,可以给 <var>CF<sub>p</sub></var> 添加新属性值的方式为 <var>cf<sub>1</sub></var>、<var>cf<sub>2</sub></var>、<var>cf<sub>3</sub></var>、<var>cf<sub>4</sub></var>、<var>cf<sub>5</sub></var> 添加一个新的共享属性。
ECMAScript 语言认为存在部分希望限制语言中某些功能的用户。他们这样做可能是为了安全考虑,规避那些他们认为容易出错的功能,从而获得更强的错误检查,或者其他原因。为了支持这种可能的情况,ECMAScript 定义了语言的严格变体。语言的严格变体,排除了 ECMAScript 语言中某些特定的句法和语义特征,还修改了某些功能的详细语义。严格变体还指定了额外一些必须抛出错误异常报告的错误条件,而在非严格的语言模式下这些条件不属于错误。
ECMAScript 的严格变体通常被称为语言的 严格模式。严格模式选择使用 ECMAScript 严格模式的语法和语义,明确地适用于个别 ECMAScript 代码单元级别。由于严格模式适用于选择的语法代码单元级别,严格模式只会在这个代码单元内施加带有局部效果的限制。严格模式不在语义层面限制或修改任何必须在多个代码单元运行的 ECMAScript 代码。一个 ECMAScript 程序可由严格模式和非严格模式的代码单元组成。在这种情况下,严格的模式只适用于严格模式代码单元内实际执行的代码。
为了符合本规范,ECMAScript的实现必须实现两套,非严格模式ECMAScript语言和ECMAScript语言严格模式变体,作为这份规范的定义。此外,实现必须支持非严格模式和严格模式代码单元组合成一个单独的复合程序。
本文档将使用下列术语和定义。
本规范 第8章 定义数据的集合。
在本规范的 第8章 定义的 Undefined、Null、Boolean、Number、String 类型之一的成员。
对象类型的成员。
创建和初始化对象的函数对象。
为其他对象提供共享属性的对象。
ECMAScript 实现中完全由本规范定义其语义而不掺入任何宿主环境定义的对象。
由 ECMAScript 实现提供,独立于宿主环境的对象,ECMAScript 程序开始执行时就存在。
由宿主环境提供的对象,用于完善 ECMAScript 执行环境。
说明一个变量没有被分配值的一个原始值。
undefined 值是 Undefined 类型绝无仅有的一个值。
代表对象值故意留空的一个原始值。
null 值是 Null 类型绝无仅有的一个值。
Boolean 类型的成员。
由原始值 true 和 false 组成的类型。
Object 类型的成员,它是标准内置构造器 Boolean 的实例。
原始值,它是零个或多个16位无符号整数组成的有限有序序列。
所有可能的 String 值的集合。
Object 类型的成员,它是标准内置构造器 String 的实例。
原始值,对应一个64位双精度二进制 IEEE754 值。
所有可能的数字值的集合,包括特殊的“Not-a-Number”(NaN) 值、正无穷、负无穷。
对象类型的成员,它是标准内置构造器 Number 的一个实例。
正无穷 Number 值。
值为 IEEE 754“Not-a-Number”的 Number 值。
Object 类型的成员,标准内置构造器 Function 的一个实例,并且可作为子程序被调用。
属于函数的内置对象。
一个名称和一个值之间的关联;属性本身是对象的一部分。
作为属性值的函数。
属于内置函数的方法。
用于定义属性的一些特征的内部值。
对象直接拥有的属性。
不是对象的自身属性,但是对象原型的属性(可以是自身或继承的)。