A.该数据集可以在两趟内实现排序,磁盘读写次数为40000次B.该数据集不能在两趟内实现排序,磁盘读写次数为60000次C.该数据集不能在两趟内实现排序,磁盘读写次数为40400次D.该数据集可以在两趟内实现排序,磁盘读写次数为40400次
单项选择题已知内存共有8块,若要排序有70块的数据集,应如何组织,才能使磁盘读写次数最少。下列方案中磁盘读写次数最少的方案是()。
A.方案I:(1)以8块为一个单位划分子集合,每个子集合进行内排序并存储,形成9个已排序子集合(其中包含一个仅有6块的子集合);(2)接着在9个子集合中选择3个子集合(其中包含仅有6块的子集合),进行一个三路归并,形成一个已排序子集合;(3)再将剩余5个子集合与刚才归并后形成的子集合,进行一个七路归并,形成最终的已排序集合。这个方案的磁盘读写次数最少B.方案IV:(1)以8块为一个单位划分子集合,每个子集合进行内排序并存储,形成9个已排序子集合;(2)接着在9个子集合中任选5个子集合进行一个五路归并,形成一个已排序子集合;(3)再将剩余4个子集合与刚才归并后形成的子集合,进行一个五路归并,形成最终的已排序集合。这个方案的磁盘读写次数最少C.方案III:(1)以8块为一个单位划分子集合,每个子集合进行内排序并存储,形成9个已排序子集合(其中包含一个仅有6块的子集合);(2)接着在9个子集合中任选七个子集合进行一个七路归并,形成一个已排序子集合;(3)再将剩余2个子集合与刚才归并后形成的子集合,进行一个三路归并,形成最终的已排序集合。这个方案的磁盘读写次数最少D.方案II:(1)以7块为一个单位划分子集合,每个子集合进行内排序并存储,形成10个已排序子集合;(2)接着在10个子集合中任选5个子集合进行一个五路归并,形成一个已排序子集合;(3)再将剩余5个子集合与刚才归并后形成的子集合,进行一个六路归并,形成最终的已排序集合。这个方案的磁盘读写次数最少
单项选择题分组聚集操作的一趟扫描算法()。
A.算法的关键是建立内存数据结构,可以建立散列结构,也可以建立排序结构,目的是进行快速比较B.算法需要首先对R的所有数据建立内存数据结构,然后才能进行各个分组的聚集计算C.算法可以边执行边建立内存数据结构,即仅对已处理过的数据建立内存数据结构,便可进行各个分组的聚集计算D.非精确的讲,算法的应用前提是B(R)≤M,其中M为可用内存块数,B(R)为R中数据所占用的磁盘块数
单项选择题关于去重复&(R)操作的一趟扫描算法,下列说法不正确的是()。
A.算法可以做到只与一个内存块中的数据进行比较,即可判断出是否有重复B.算法可以边执行边建立内存数据结构,即仅对已处理过的数据建立内存数据结构C.算法需要首先对R的所有数据建立内存数据结构,然后才能判断是否有重复的元组存在D.非精确的讲,算法的应用前提是B(R)≤M,其中M为可用内存块数,B(R)为R中数据所占用的磁盘块数
单项选择题已知关系R的参数如下:聚簇存储磁盘块数B(R)=1,000,元组数T(R)=20,000,R中属性A的不同值的个数被记为V(R,A)=100。R上有基于属性A的排序索引。关于σA=0(R),下列说法正确的是()。
A.如果R是聚簇存储的且使用索引,则该操作的执行代价为1000个I/OB.如果R是聚簇存储的且使用索引,则该操作的执行代价平均为100个I/OC.如果R是聚簇存储的且不使用索引,则该操作的执行代价为1000个I/OD.如果不使用索引,则该操作的执行代价为1000个I/O
单项选择题假设关系R的元组个数为T(R),元组的大小为I(R),存储块的大小为b,B(R)=T(R)*I(R) b。关于表空间扫描算法,下列说法正确的是()。
A.表空间扫描算法的复杂性可能为B(R),也可能为T(R)B.其他说法都不正确C.表空间扫描算法的复杂性始终为T(R)D.表空间扫描算法的复杂性始终为B(R)