银符考试题库-在线练习-Oracle程序员面试分类模拟1

二、简答题

1. 为什么使用数据库?

对于这个面试题，可以举例回答。看如下的例子：
(1)京东网、淘宝网、天涯网、腾讯网等都有各自的功能，那么当关闭系统后，用户下次再访问这些网站时，为什么他/她们各自的信息还存在呢?
(2)基于C/S架构的软件，例如，网游的游戏积分和装备、QQ的聊天记录、三大运营商的电话号码，它们又是怎样保存数据的呢?
解决之道无非有两种方式：①文件、②数据库。虽然说文件可以保存数据，可是如果使用文件保存数据，那么存在以下几个缺点：①文件的安全性问题，一般的文件格式容易被黑客截取并获取到其中的内容。②文件不利于查询和对数据的管理。③文件不利于存放海量数据。④文件在程序中控制不方便。
那么，为了解决上述问题，专家们设计出了一种更加有利于管理数据的方法——数据库(本质就是一个软件)，它能更有效地管理数据，现如今对数据库的理解程度也是衡量一个程序员水平高低的重要指标。

2. 数据库的常见分类有哪些?

数据库可以按照存储模型、关系型/非关系型来进行分类，其分类如图所示。

数据库的总体分类图

1．网状数据库、层次数据库
数据库若按照使用的数据存储模型来划分，则可以把数据库分为网状数据库(Network Database)、关系型数据库(Relational Database)和层次数据库(Hierarchical Database)。其中，商业中使用最广泛的数据库主要是关系型数据库，例如，Oracle、MySQL、DB2、SQL Server等。
网状数据库(Network Database)是指处理以记录类型为节点的网状数据模型的数据库，处理方法是将网状结构分解成若干棵二级树结构，称为系，其代表是DBTG(DataBase Task Group，数据库任务组)系统。系类型是两个或两个以上的记录类型之间联系的一种描述。在一个系类型中，有一个记录类型处于主导地位，称为系主记录类型，其他称为成员记录类型。系主和成员之间的联系是一对多的关系。1969年美国的CODASYL组织提出了一份“DBTG报告”，以后，根据DBTG报告实现的系统一般称为DBTG系统。现有的网状数据库系统大都是采用DBTG方案。DBTG系统是典型的三级结构体系：子模式、模式、存储模式。相应的数据定义语言分别称为子模式定义语言SSDDL(SubSchema Data Definition Language)，模式定义语言SDDL(Schema Data Definition Language)，设备介质控制语言DMCL(Device Medium Control Language)，另外，还有数据操纵语言DML(Data Manipulation Language)。
层次数据库(Hierarchical Database)也称为树状数据库，它是将数据组织成有向有序的树结构，并用“一对多”的关系联结不同层次的数据库。最著名最典型的层次数据库是IBM公司的IMS(Information Management System)数据库。IMS是IBM公司研制的最早的大型数据库管理系统，其数据库模式是多个物理数据库记录型(PDBR，Physical Data Base Record)的集合。每个PDBR对应层次数据模型的一个层次模式。各个用户所需数据的逻辑结构称为外模式，每个外模式是一组逻辑数据库记录型(LDBR，Logical Data Base Record)的集合。LDBR是应用程序所需的局部逻辑结构。
2．关系型数据库
RDBMS(Relational Database Management System，关系型数据库管理系统)是E．F．Codd博士在其发表的论文《大规模共享数据银行的关系型模型》(Communications of the ACM杂志1970年6月刊)基础上设计出来的。关系型数据库是将数据组织为相关的行和列的系统，而管理关系型数据库的计算机软件就是RDBMS。它通过数据、关系和对数据的约束三者组成的数据模型来存放和管理数据。自关系型数据库管理系统被提出以来，RDBMS获得了长足的发展，许多企业的在线交易处理系统、内部财务系统、客户管理系统等采用了RDBMS。
关系型数据库，顾名思义是建立在关系模型基础上的数据库，借助于集合代数等数学概念和方法来处理数据库中的数据。现实世界中的各种实体以及实体之间的各种联系均用关系模型来表示。结构化查询语言(Structured Query Language，简称SQL)就是一种基于关系型数据库的语言，这种语言执行对关系型数据库中数据的检索和操作。关系模型由关系数据结构、关系操作集合、关系完整性约束三部分组成。截至2017年，业界普遍使用的关系型数据库管理系统产品有Oracle、MySQL、DB2以及SQL Server等。若按照大小来分类的话，则关系型数据库可以简单分为如下几类：①小型数据库：Access、foxbase。②中型数据库：MySQL、SQL Server、Informix。③大型数据库：Oracle、DB2。
RDBMS的特点如下：①数据以表格的形式出现。②每一行存储着一条单独的记录。③每个列作为一条记录的一个属性而存在。④许多的行和列组成一张表。⑤若干的表组成数据库。
3．内存数据库
内存数据库，顾名思义就是将数据放在内存中直接操作的数据库。相对于磁盘，内存的数据读写速度要高出几个数量级，将数据保存在内存中相比从磁盘上访问能够极大地提高应用的性能，典型的内存数据库有SQLite和TimesTen。SAP公司专门开发了一款大型的内存数据库HANA，并且在逐步占领市场，而传统的数据库巨头Oracle公司开发的TimesTen也是一款内存数据库。可以预见，内存数据库将会是未来的一个发展趋势。
4．Oracle、MySQL、SQL Server
Oracle数据库，又名Oracle RDBMS，或简称Oracle，是甲骨文公司的一款关系型数据库管理系统。它是一款一直处于领先地位的数据库领域产品。可以说Oracle数据库系统是目前世界上流行的关系型数据库管理系统，系统可移植性好、使用方便、功能强大，适用于各类大、中、小、微机环境。它是一种高效率、可靠性好、适应高吞吐量的数据库解决方案。
MySQL是一个关系型数据库管理系统，由瑞典MySQL AB公司开发，目前属于Oracle公司。MySQL是最流行的关系型数据库管理系统，在Web应用方面，MySQL是最好的RDBMS(Relational Database Management System，关系型数据库管理系统)应用软件之一，广泛地应用于互联网行业。
SQL Server(Microsoft SQL Server，MS Server)是由Microsoft开发和推广的关系型数据库管理系统(DBMS)，它最初是由Microsoft、Sybase和Ashton-Tate三家公司共同开发的，并于1988年推出了第一个OS/2版本。SQL Server是一个全面的数据库平台，使用集成的商业智能(Business Intelligence，简称BI)工具提供了企业级的数据管理。SQL Server数据库引擎为关系型数据和结构化数据提供了更安全可靠的存储功能，使用户可以构建和管理用于业务的高可用和高性能的数据应用程序。SQL Server近年来不断更新版本，目前最新的版本是SQL Server 2016，并且微软正在研发基于Linux版本的SQL Server，可见SQL Server在关系型数据库中也占有一席之地。
常见的关系型数据库的特点见表1。

5．非关系型数据库
NoSQL(Not Only SQL)泛指非关系型的数据库，即“不仅仅是SQL”。随着Web2.0的兴起，传统的关系型数据库在应付Web2.0网站，特别是超大规模和高并发的SNS(Social Network Site，社交网)类型的Web2.0纯动态网站时已经显得力不从心，暴露了很多难以克服的问题，而非关系型数据库则由于其本身的特点得到了非常迅速的发展。NoSQL数据库的产生就是为了解决大规模数据集合多重数据种类带来的挑战，尤其是大数据应用难题。NoSQL的拥护者们提倡运用非关系型的数据存储，相对于铺天盖地的关系型数据库运用，这一概念无疑是一种全新的思维的注入。
NoSQL数据库大约有四大分类：键值(Key-Value)数据库、列存储数据库、文档型数据库和图形(Graph)数据库。
1)对于键值(Key-Value)数据库，主要会使用到一个哈希表，这个表中有一个特定的键和一个指向特定数据的指针。Key-Value模型对于信息系统来说，其优势在于简单、易部署，但是如果只对部分值进行查询或更新，那么键值数据库就显得效率低下了。常见的键值数据库有：Redis、LevelDB、RocksDB、Riak KV、Oracle Berkeley DB、Hazelcast、Ehcache、Memcached等。
2)对于列存储数据库，通常是用来应对分布式存储的海量数据，键仍然存在，但是它们的特点是键指向了多个列。常见的列存储数据库有：HBase、Cassandra、Accumulo、HyperTable等。
3)对于文档型数据库，其灵感来自于Lotus Notes办公软件，而且它与第一种键值存储类似。这种类型的数据模型是版本化的文档，半结构化的文档以特定的格式存储，例如JSON。文档型数据库可以看作是键值数据库的升级版，允许它们之间嵌套键值，而且文档型数据库比键值数据库的查询效率更高。常见的文档型数据库有：CouchDB、MongoDB等。国内也有文档型数据库SequoiaDB，该数据库已经开源。
如果说Oracle是关系型数据库的王者，那么MongoDB可以说是非关系型数据库的霸主。MongoDB是一个基于分布式文件存储的数据库，它由C++语言编写，旨在为Web应用提供可扩展的高性能数据存储解决方案。它支持的数据结构非常松散，因此，可以存储比较复杂的数据类型。MongoDB最大的特点是支持的查询语言非常强大，其语法有点类似于面向对象的查询语言，几乎可以实现类似关系型数据库单表查询的绝大部分功能，而且还支持对数据建立索引。
4)对于图形(Graph)数据库，它与其他行列以及刚性结构的SQL数据库不同，它是使用灵活的图形模型，并且能够扩展到多台服务器上。NoSQL数据库没有标准的查询语言(SQL)，因此，进行数据库查询需要制定数据模型。许多NoSQL数据库都有REST式的数据接口或者查询API。常见的图形数据库有：Neo4j、InfoGrid、InfiniteGraph、Titan、Giraph等。
常见的非关系型数据库的优缺点及其应用场景见表2。

表3总结了MongoDB、Riak KV，Hypertable和HBase这四个产品的主要特性。

6．行存储和列存储
将表放入存储系统中的方法有两种：行存储和列存储，绝大部分数据库是采用行存储的。行存储法是将各行放入连续的物理位置，这很像传统的记录和文件系统，然后由数据库引擎根据每个查询提取需要的列。列存储法是将数据按照列存储到数据库中，与行存储类似。具体而言，行存储和列存储的区别见表4。

3. 数据库的约束有哪些?

在数据库表的开发中，约束是必不可少的，使用约束可以更好地保证数据库中数据的完整性。
1．约束(CONSTRAINT)
数据的完整性是指数据的正确性和一致性，可以在定义表时定义完整性约束，也可以通过索引或触发器等方式定义完整性约束。约束分为两类：行级和表级，二者处理机制是一样的。行级约束放在列后，表级约束放在表后，多个列共用的约束放在表后。
完整性约束是一种规则，不占用任何数据库空间。它存在数据字典中，在执行SQL或PL/SQL期间使用。用户可以指明约束是启用还是禁用，当约束启用时，它增强了数据的完整性，否则，约束始终存在于数据字典中。
2．约束类型
约束主要分为以下五种不同类型：主键约束、唯一约束、检查约束、非空约束和外键约束。
(1)主键约束(Primary Key)主键是一个唯一的标识，本身不能为空，即主键必须非空且唯一。例如：身份证编号是唯一的，不可重复，不可为空。
(2)唯一约束(UNIQUE)在一个表中，只允许建立一个主键约束，而对于其他列，如果不希望出现重复值的话，那么可以使用唯一约束。
(3)检查约束(CHECK)检查一列的内容是否合法。例如性别，只能是男或女。
(4)非空约束(NOTNULL)员工生日这样的字段里面的内容就不能为空。
(5)外键约束(Foreign Key)在两张表中进行约束操作。主键是一个非空且唯一的约束，外键是在两张表中进行约束，外键的取值必须是参照的主键值或空值。
关系型数据库中的一条记录中有若干个属性，如果其中某一个属性组(注意是组)能唯一标识一条记录，那么该属性组就可以成为一个主键。
例如：学生表(学号，姓名，性别，班级)其中，每个学生的学号是唯一的，学号就是一个主键。
课程表(课程编号，课程名，学分)其中，课程编号是唯一的，课程编号就是一个主键。
成绩表(学号，课程号，成绩)其中，成绩表中单一一个属性无法唯一标识一条记录，学号和课程号的组合才可以唯一标识一条记录，所以，学号和课程号的属性组是一个主键。
成绩表中的学号不是成绩表的主键，但它和学生表中的学号相对应，并且学生表中的学号是学生表的主键，则称成绩表中的学号是学生表的外键；同理，成绩表中的课程号是课程表的外键。
表的主键和外键的作用如下：
1)当插入非空值时，若主键表中没有这个值，则不能插入。
2)当更新外键时，不能改为主键表中没有的值。
3)当删除主键表记录时，可以在创建外键约束时选定外键记录一起级联删除还是拒绝删除。
4)当更新主键记录时，同样有级联更新和拒绝执行的选择。
表的主键和外键就是起约束作用，定义主键和外键主要是为了维护关系型数据库的完整性，在使用主键与外键时，通常需要注意以下内容：
1)主键是能确定一条记录的唯一标识，例如，一条记录包括身份证号、姓名和年龄。身份证号是唯一能确定一个人的个人信息，其他信息都可能有重复，但是身份证却不能重复，所以，身份证号是主键。
2)外键用于与另一张表进行关联。它能确定另一张表记录的字段，用于保持数据的一致性。例如，A表中的一个字段，是B表的主键，那它就是A表的外键。

4. 什么是第一、二、三、BC范式?

当设计关系型数据库时，需要遵从不同的规范要求，设计出合理的关系型数据库，这些不同的规范要求被称为不同的范式(Normal Form)，越高的范式数据库冗余越小。应用数据库范式可以带来许多好处，但是最主要的目的是为了消除重复数据减少数据冗余，让数据库内的数据更好地组织，让磁盘空间得到更有效的利用。所谓“第几范式”，是表示关系的某一种级别，所以经常称某一关系R为第几范式。
目前关系型数据库有六种范式：第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、巴斯-科德范式(BCNF)、第四范式(4NF)和第五范式(5NF，又称完美范式)。满足最低要求的范式是第一范式(1NF)。在第一范式的基础上进一步满足更多规范要求的称为第二范式(2NF)，其余范式依次类推。一般说来，数据库只需满足第三范式(3NF)就行了。满足高等级的范式的先决条件是必须先满足低等级范式。
在关系数据库中，关系是通过表来表示的。在一个表中，每一行代表一个联系，而一个关系就是由许多的联系组成的集合。所以，在关系模型中，关系用来指代表，而元组用来指代行，属性就是表中的列。对于每一个属性，都存在一个允许取值的集合，称为该属性的域。
下面介绍范式中会用到的一些常用概念。
(1)实体(Entity)就是实际应用中要用数据描述的事物，它是现实世界中客观存在并可以被区别的事物，一般是名词。比如“一个学生”、“一本书”、“一门课”等。值得强调的是，这里所说的“事物”不仅仅是看得见摸得着的“东西”，它也可以是虚拟的，比如说“老师与学校的关系”。
(2)数据项(Data Item) 即字段(Fields)也可称为域、属性、列。数据项是数据的不可分割的最小单位。数据项可以是字母、数字或两者的组合。通过数据类型(逻辑的、数值的、字符的等)及数据长度来描述。数据项用来描述实体的某种属性。数据项包含数据项的名称、编号、别名、简述、数据项的长度、类型、数据项的取值范围等内容。教科书上解释为：“实体所具有的某一特性”，由此可见，属性一开始是个逻辑概念，比如说，“性别”是“人”的一个属性。在关系数据库中，属性又是个物理概念，属性可以看作是“表的一列”。
(3)数据元素(Data Element)数据元素是数据的基本单位。数据元素也称元素、行、元组、记录(Record)。一个数据元素可以由若干个数据项组成。表中的一行就是一个元组。
(4)码也称为键(Key)，它是数据库系统中的基本概念。所谓码就是能唯一标识实体的属性，它是整个实体集的性质，而不是单个实体的性质。它包括超码、候选码和主码。
(5)超码超码是一个或多个属性的集合，这些属性的组合可以在一个实体集中唯一地标识一个实体。如果K是一个超码，那么K的任意超集也是超码，也就是说如果K是超码，那么所有包含K的集合也是超码。
(6)候选码在一个超码中，可能包含了无关紧要的属性，如果对于一些超码，它们的任意真子集都不能成为超码，那么这样的最小超码称为候选码。
(7)主码从候选码中挑一个最少键的组合，它就称为主码(主键，Primary Key)。每个主码应该具有下列特征：①唯一的。②最小的(尽量选择最少键的组合)。③非空。④不可更新的(不能随时更改)。
(8)全码如果一个码包含了所有的属性，这个码就是全码(All-key)。
(9)主属性一个属性只要在任何一个候选码中出现过，这个属性就是主属性(Prime Attribute)。
(10)非主属性与主属性相反，没有在任何候选码中出现过，这个属性就是非主属性(Nonprime Attribute)或非码属性(Non-key Attribute)。
(11)外码关系模式R中的一个属性或属性组X并非R的码，但X是另一个关系模式的码，则称X是R的外码，也称外键(Foreign Key)。例如，在SC(Sno，Cno，Grade)中，Sno不是码，但Sno是关系模式S(Sno，Sdept，Sage)的码，则Sno是关系模式SC的外码。主码与外码一起提供了表示关系间联系的手段。
(12)依赖表(Dependent Table)也称为弱实体(Weak Entity)，是需要用父表标识的子表。
(13)关联表(Associative Table)是多对多关系中两个父表的子表。
(14)函数依赖函数依赖是指关系中一个或一组属性的值可以决定其他属性的值。函数依赖就像一个函数y=f(x)一样，x的值给定后，y的值也就唯一地确定了，写作X→Y。函数依赖不是指关系模式R的某个或某些关系满足的约束条件，而是指R的一切关系均要满足的约束条件。
(15)完全函数依赖在一个关系中，若某个非主属性数据项依赖于全部关键字称之为完全函数依赖。例如，在成绩表(学号，课程号，成绩)关系中，(学号，课程号)可以决定成绩，但是学号不能决定成绩，课程号也不能决定成绩，所以“(学号，课程号)→成绩”就是完全函数依赖。
(16)传递函数依赖指的是如果存在“A→B→C”的决定关系，则C传递函数依赖于A。
下面开始介绍各种范式。
1．第一范式(1NF)：属性不可分
所谓第一范式(1NF)是指在关系模型中，对域添加的一个规范要求，所有的域都应该是原子性的，即数据库表的每一列都是不可分割的原子数据项，而不能是集合、数组、记录等非原子数据项。即当实体中的某个属性有多个值时，必须将其拆分为不同的属性。在符合第一范式(1NF)表中的每个域值只能是实体的一个属性或一个属性的一部分。简而言之，第一范式就是无重复的域。例如，由“职工号”、“姓名”、“电话号码”组成的职工表，由于一个人可能有一个办公电话和一个移动电话，所以，这时可以将其规范化为1NF。将电话号码分为“办公电话”和“移动电话”两个属性，即职工表(职工号，姓名，办公电话，移动电话)。
需要注意的是，在任何一个关系型数据库中，第一范式(1NF)是对关系模式的设计基本要求，一般设计时都必须满足第一范式(1NF)。不过有些关系模型中突破了1NF的限制，这种称为非1NF的关系模型。换句话说，是否必须满足1NF的最低要求，主要依赖于所使用的关系模型。不满足1NF的数据库就不是关系数据库。满足1NF的表必须要有主键且每个属性不可再分。
2．第二范式(2NF)
符合1NF，并且，非主属性完全依赖于码。
在1NF的基础上，每一个非主属性必须完全依赖于码(在1NF基础上，消除非主属性对主键的部分函数依赖)。
第二范式(2NF)是在第一范式(1NF)的基础上建立起来的，即满足第二范式(2NF)必须先满足第一范式(1NF)。第二范式(2NF)要求数据库表中的每个实体或记录必须可以被唯一地区分。选取一个能区分每个实体的属性或属性组，作为实体的唯一标识。
例如，在选课关系表(学号，课程号，成绩，学分)中，码为组合关键字(学号，课程号)。但是，由于非主属性学分仅仅依赖于课程号，对关键字(学号，课程号)只是部分依赖，而不是完全依赖，所以，此种方式会导致数据冗余、更新异常、插入异常和删除异常等问题，其设计不符合2NF。解决办法是将其分为两个关系模式：学生表(学号，课程号，分数)和课程表(课程号，学分)，新关系通过学生表中的外键字课程号联系，在需要时通过两个表的连接来取出数据。
第二范式(2NF)要求实体的属性完全依赖于主关键字。所谓完全依赖是指不能存在仅依赖主关键字一部分的属性，如果存在，那么这个属性和主关键字的这一部分应该分离出来形成一个新的实体，新实体与原实体之间是一对多的关系。为实现区分通常需要为表加上一个列，以存储各个实例的唯一标识。简而言之，第二范式就是在第一范式的基础上属性完全依赖于主键。
所有单关键字的数据库表都符合第二范式，因为不可能存在组合关键字。
3．第三范式(3NF)
在1NF基础上，每个非主属性既不部分依赖于码也不传递依赖于码(在2NF基础上消除传递依赖)。如果关系模式R是第二范式，且每个非主属性都不传递依赖于R的码，则称R是第三范式的模式。第三范式(3NF)是第二范式(2NF)的一个子集，即满足第三范式(3NF)必须满足第二范式(2NF)。
例如，学生表(学号，姓名，课程号，成绩)，其中学生姓名若无重名，所以，该表有两个候选码(学号，课程号)和(姓名，课程号)，则存在函数依赖：学号一姓名，(学号，课程号)→成绩，(姓名，课程号)→成绩，唯一的非主属性成绩对码不存在部分依赖，也不存在传递依赖，所以，属于第三范式。
满足第三范式的数据库表应该不存在如下依赖关系：
关键字段→非关键字段x→非关键字段y
假定学生关系表为(学号，姓名，年龄，所在学院，学院地点，学院电话)，关键字为单一关键字“学号”，因为存在如下决定关系：
(学号)→(姓名，年龄，所在学院，学院地点，学院电话)
这个关系是符合2NF的，但是不符合3NF，因为存在如下决定关系：
(学号)→(所在学院)→(学院地点，学院电话)
即存在非关键字段“学院地点”、“学院电话”对关键字段“学号”的传递函数依赖。它也会存在数据冗余、更新异常、插入异常和删除异常的情况。若把学生关系表分为如下两个表：
学生：(学号，姓名，年龄，所在学院)。
学院：(学院，地点，电话)。
这样的数据库表是符合第三范式的，消除了数据冗余、更新异常、插入异常和删除异常。
4．BCNF(Boyce-Codd Normal Form)
在1NF基础上，任何非主属性不能对主键子集依赖(在3NF基础上消除对主键子集的依赖)。
若关系模式R是第一范式，且每个属性(包括主属性)既不存在部分函数依赖也不存在传递函数依赖于R的候选键，这种关系模式就是BCNF模式。即在第三范式的基础上，数据库表中如果不存在任何字段对任一候选关键字段的传递函数依赖则符合BCNF。BCNF是修正的第三范式，有时也称扩充的第三范式。
BCNF是第三范式(3NF)的一个子集，即满足BCNF必须满足第三范式(3NF)。通常情况下，BCNF被认为没有新的设计规范加入，只是对第二范式与第三范式中设计规范要求更强，因而被认为是修正第三范式，也就是说，它事实上是对第三范式的修正，使数据库冗余度更小。这也是BCNF不被称为第四范式的原因。
对于BCNF，在主键的任何一个真子集都不能决定于主属性。关系中U主键，若U中的任何一个真子集X都不能决定于主属性Y，则该设计规范属性BCNF。例如：在关系R中，U为主键，A属性是主键中的一个属性，若存在A→Y，Y为主属性，则该关系不属于BCNF。
假设仓库管理关系表(仓库号，存储物品号，管理员号，数量)，满足一个管理员只在一个仓库工作；一个仓库可以存储多种物品。则存在如下关系：
(仓库号，存储物品号)→(管理员号，数量)
(管理员号，存储物品号)→(仓库号，数量)
所以，(仓库号，存储物品号)和(管理员号，存储物品号)都是仓库管理关系表的候选码，表中的唯一非关键字段为数量，它是符合第三范式的。但是，由于存在如下决定关系：
(仓库号)→(管理员号)
(管理员号)→(仓库号)
即存在关键字段决定关键字段的情况，所以，其不符合BCNF范式。把仓库管理关系表分解为两个关系表：仓库管理表(仓库号，管理员号)和仓库表(仓库号，存储物品号，数量)，这样的数据库表是符合BCNF范式的，消除了删除异常、插入异常和更新异常。
四种范式之间存在如下关系：

学习了范式，为了巩固理解，接下来设计一个论坛的数据库，该数据库中需要存放如下信息：
(1)用户用户名，EMAIL，主页，电话，联系地址。
(2)帖子发帖标题，发帖内容，回复标题，回复内容。
第一次可以将数据库设计为仅仅存在一张表：
用户名EMAIL主页电话联系地址发帖标题发帖内容回复标题回复内容
这个数据库表符合第一范式，但是没有任何一组候选关键字能决定数据库表的整行，唯一的关键字段用户名也不能完全决定整个元组。所以，需要增加“发帖ID”、“回复ID”字段，即将表修改为：
用户名EMAIL主页电话联系地址发帖ID发帖标题发帖内容回复ID回复标题回复内容
这样数据表中的关键字(用户名，发帖ID，回复ID)能决定整行：
(用户名，发帖ID，回复ID)→(EMAIL，主页，电话，联系地址，发帖标题，发帖内容，回复标题，回复内容)
但是，这样的设计不符合第二范式，因为存在如下决定关系：
(用户名)→(EMAIL，主页，电话，联系地址)
(发帖ID)→(发帖标题，发帖内容)
(回复ID)→(回复标题，回复内容)
即非关键字段部分函数依赖于候选关键字段，很明显，这个设计会导致大量的数据冗余和操作异常。
因此，需要对这张表进行分解，具体可以分解为(带下画线的为关键字)：
(1)用户信息用户名，EMAIL，主页，电话，联系地址。
(2)帖子信息发帖ID，标题，内容。
(3)回复信息回复ID，标题，内容。
(4)发帖用户名，发帖ID。
(5)回复发帖ID，回复ID。
这样的设计是满足第1、2、3范式和BCNF范式要求的，但是这样的设计是不是最好的呢?不一定。
观察可知，第4项“发帖”中的“用户名”和“发帖ID”之间是1:N的关系，因此，可以把“发帖”合并到第2项的“帖子信息”中；第5项“回复”中的“发帖ID”和“回复ID”之间也是1:N的关系，因此，可以把“回复”合并到第3项的“回复信息”中。这样可以一定程度地减少数据冗余，新的设计如下所示：
(1)用户信息用户名，EMAIL，主页，电话，联系地址。
(2)帖子信息用户名，发帖ID，标题，内容。
(3)回复信息发帖ID，回复ID，标题，内容。
数据库表1显然满足所有范式的要求。
数据库表2中存在非关键字段“标题”、“内容”对关键字段“发帖ID”的部分函数依赖，满足第二范式的要求，但是这一设计并不会导致数据冗余和操作异常。
数据库表3中也存在非关键字段“标题”、“内容”对关键字段“回复ID”的部分函数依赖，也不满足第二范式的要求，但是与数据库表2相似，这一设计也不会导致数据冗余和操作异常。
由此可以看出，并不一定要强行满足范式的要求，对于1:N关系，当1的一边合并到N的那边后，N的那边就不再满足第二范式了，但是这种设计反而比较好。
对于M:N的关系，不能将M一边或N一边合并到另一边去，这样会导致不符合范式要求，同时导致操作异常和数据冗余。
对于1:1的关系，可以将左边的1或者右边的1合并到另一边去，设计导致不符合范式要求，但是并不会导致操作异常和数据冗余。
所以，满足范式要求的数据库设计是结构清晰的，同时可避免数据冗余和操作异常。这并意味着不符合范式要求的设计一定是错误的，在数据库表中存在1:1或1:N关系这种较特殊的情况下，合并导致的不符合范式要求反而是合理的。
所以，在数据库设计的时候，一定要时刻考虑范式的要求。

设有关系模式R(职工名，项目名，工资，部门名，部门经理)。
如果规定，每个职工可参加多个项目，各领一份工资；每个项目只属于一个部门管理；每个部门只有一个经理。

5. 试写出关系模式R的基本函数依赖和主码。

根据题意，可知有如下的函数依赖关系：
(职工名，项目名)→工资
项目名→部门名
部门名→部门经理
所以，主键为(职工名，项目名)。

6. 说明R不是2NF模式的理由，并把R分解成2NF。

根据上一小题，由于部门名、部门经理只是部分依赖于主键，所以该关系模式不是2NF。应该做如下分解：
R1(项目名，部门名，部门经理)
R2(职工名，项目名，工资)
以上两个关系模式都是2NF模式。

7. 进而将R分解成3NF，并说明理由。

R2已经是3NF，但R1不是，因为部门经理传递依赖于项目名，故应该做如下分解：
R11(项目名，部门名)
R12(部门名，部门经理)
分解后形成的三个关系模式R11、R12、R2均是3NF模式。