view Renderer/Engine/spe/CreateSpan.cc @ 1319:31455d34e502 draft

collada file reader minor changes.
author Taiki TAIRA <e095767@ie.u-ryukyu.ac.jp>
date Sun, 18 Dec 2011 09:39:14 +0900
parents 614562ada648
children 95b114c66e14
line wrap: on
line source

// #define DEBUG
#include "CreateSpan.h"
#include "viewer_types.h"
#include "matrix_calc.h"
#include "Tapestry.h"
#include "Func.h"


// DMA channel
static const int SPAN_PACK_LOAD    =  5;
static const int SPAN_PACK_STORE   =  6;
static const int POLYGON_PACK_LOAD =  7;
static const int TILE_ALLOCATE     =  8;
static const int TILE_LOAD         =  9;
static const int TILE_STORE        = 10;

static SpanPackPtr spack = NULL;
static SpanPackPtr send_spack = NULL;
static int prev_index = 0;


SchedDefineTask(CreateSpan);

static float
calc(float f1, float f2,int i, float base)
{
    float ans;
    ans = f1/f2*i + base;
    return ans;
}


/**
 * TrianglePack から、vMin, vMid, vMax を求める
 *
 * @param [triPack] TrianglePack
 * @param [vMin] [vMid] [vMax]
 */
static void
make_vertex(TrianglePack *triPack,
	    VertexPackPtr *vMin, VertexPackPtr *vMid, VertexPackPtr *vMax,
            NormalPackPtr *normal1, NormalPackPtr *normal2, NormalPackPtr *normal3)
{
    if (triPack->ver1.y <= triPack->ver2.y) {
	if (triPack->ver2.y <= triPack->ver3.y) {
	    *vMin = &triPack->ver1;
	    *vMid = &triPack->ver2;
	    *vMax = &triPack->ver3;
	} else if (triPack->ver3.y <= triPack->ver1.y) {
	    *vMin = &triPack->ver3;
	    *vMid = &triPack->ver1;
	    *vMax = &triPack->ver2;
	} else {
	    *vMin = &triPack->ver1;
	    *vMid = &triPack->ver3;
	    *vMax = &triPack->ver2;
	}
    } else {
	if (triPack->ver1.y <= triPack->ver3.y) {
	    *vMin = &triPack->ver2;
	    *vMid = &triPack->ver1;
	    *vMax = &triPack->ver3;
	} else if (triPack->ver3.y <= triPack->ver2.y) {
	    *vMin = &triPack->ver3;
	    *vMid = &triPack->ver2;
	    *vMax = &triPack->ver1;
	} else {
	    *vMin = &triPack->ver2;
	    *vMid = &triPack->ver3;
	    *vMax = &triPack->ver1;
	}
    }

    *normal1 = &triPack->normal1;
    *normal2 = &triPack->normal2;
    *normal3 = &triPack->normal3;

}

static void
make_vMid10(VertexPack *v, VertexPack *vMin,
	    VertexPack *vMid, VertexPack *vMax)
{
    //int d, d1;
    float d;
    int d1;
    
    d  = vMax->y - vMin->y;
    d1 = (int)(vMid->y - vMin->y);

    v->tex_x  = calc(vMax->tex_x - vMin->tex_x, d, d1, vMin->tex_x);
    v->tex_y  = calc(vMax->tex_y - vMin->tex_y, d, d1, vMin->tex_y);
    v->x      = calc(vMax->x - vMin->x, d, d1, vMin->x);
    v->y      = vMid->y;
    v->z      = calc(vMax->z - vMin->z, d, d1, vMin->z);
}

/**
 * 与えられた scale から、実際に使うテクスチャの Tapestry を選択する
 *
 * テクスチャは、オリジナルのサイズから、可能なかぎり 1/2 で縮小していき、
 * 下の図の様に連続した領域に入れられる
 *
 *   Tapestry (1)
 * +---+---+---+---+
 * | 0 | 1 | 2 | 3 |
 * +---+---+---+---+
 * | 4 | 5 | 6 | 7 |     (2)
 * +---+---+---+---+  +---+---+
 * | 8 | 9 | 10| 11|  | 16| 17|   (3)
 * +---+---+---+---+  +---+---+  +---+
 * | 12| 13| 14| 15|  | 18| 19|  | 20|
 * +---+---+---+---+  +---+---+  +---|
 *
 * (1)                                                 (2)             (3)
 *  +---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+
 *  | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | * | * | * | 14| 15| 16| 17| 18| 19| 20|
 *  +---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+
 *
 * scale の値から、各 Tapestry の先頭アドレスを返す
 *
 * @param[in] tw       Width of texture
 * @param[in] th       Height of texture
 * @param[in] scale    テクスチャの縮小率 (= 2^n)
 * @param[in] addr_top テクスチャの先頭アドレス (上の図での (1)
 * @return scale に対応する Tapestry のアドレス (上の図での (1) or (2) or(3)
 */
static uint32*
getTapestry(int tw, int th, int scale, uint32 *addr_top)
{
    int index = 0;
    int diff = TEXTURE_SPLIT_PIXEL;

    for (int s = 1; s < scale; s <<= 1) {

        // makeTapestry の作り方をみると、こんな感じでindexだせるはず。眠いんでこれで勘弁(ry
	index += (align(tw, diff) / diff) * (align(th, diff) / diff) * TEXTURE_BLOCK_SIZE;
	diff <<= 1;

    }


    return addr_top + index;
}


/**
 * span の width,height と texture の width,height を比べて
 * span を描画する際に使う texture の比率を求める
 *
 * @param[in] width      Width of span
 * @param[in] height     Height of span
 * @param[in] tex_width  Width of 1/1 texture that span use
 * @param[in] tex_height Height of 1/1 texture that span use
 * @param[in] scale_max  この Span で使う texture の最大縮小率
 *                   計算結果が scale_max 以上になるのを防ぐ
 * @return 描画に使う texture の比率
 *         width と height は 1/scale の画像を使う
 *
 */
static int
getScale(int width, int height, int tex_width, int tex_height, int scale_max)
{
    int base, tex_base;
    int scale = 1;

    if (scale_max==0) return 1; // broken case
    /**
     * width と height で、長い方を基準に、
     * texture の scale を決める
     */
    if (width > height) {
	base = width;
	tex_base = tex_width;
    } else {
	base = height;
	tex_base = tex_height;
    }

    if (tex_base > base) {
	int t_scale = tex_base/base;
	while (t_scale >>= 1) {
	    scale <<= 1;
	}
    }

    return (scale > scale_max) ? scale_max : scale;
    //return scale_max;
}


static void
span_calc(SpanPackPtr spack, VertexPackPtr vMid, VertexPackPtr vMid10, VertexPackPtr vMin, 
     NormalPackPtr normal1, NormalPackPtr normal2, NormalPackPtr normal3,
     TriangleTexInfoPtr tex_info, int length_y, float tex_y_len, float div_y, int y, int i)
{

    float tmp_z,tmp_tex1, tmp_tex2 ,tmp_tey1,tmp_tey2;
    float tmp_xpos,tmp_end,tmp_zpos;
    float start_z, end_z;
    float start_tex_x, end_tex_x, start_tex_y, end_tex_y;
    int x,length;

    tmp_xpos = calc(vMid10->x - vMin->x ,div_y, i, vMin->x);
    tmp_end  = calc(vMid->x  - vMin->x ,div_y, i, vMin->x);
    tmp_z    = calc(vMid10->z - vMin->z ,div_y, i, vMin->z);
    tmp_zpos = calc(vMid->z  - vMin->z ,div_y, i, vMin->z);
    
    length = (tmp_xpos > tmp_end)
        ? (int)tmp_xpos - (int)tmp_end : (int)tmp_end - (int)tmp_xpos;
    if (length == 0) {
        return;
    }

    tmp_tex1 =((i/(div_y)) * vMid10->tex_x) +
        ( ((div_y - i)/(div_y)) * vMin->tex_x);
    tmp_tex2 =( (i/(div_y)) * vMid->tex_x) +
        ( ((div_y - i)/(div_y)) * vMin->tex_x);
    
    tmp_tey1 =( (i/(div_y)) * vMid10->tex_y) +
        ( ((div_y - i)/(div_y)) * vMin->tex_y);
    tmp_tey2 =( (i/(div_y)) * vMid->tex_y) +
        ( ((div_y - i)/(div_y)) * vMin->tex_y);
    
    if (tmp_xpos > tmp_end) {
        x = (int)tmp_end;
        length = (int)(tmp_xpos)-(int)(tmp_end)+1;
        start_z = tmp_zpos;
        end_z = tmp_z;
        start_tex_x = tmp_tex2;
        end_tex_x = tmp_tex1;
        start_tex_y = tmp_tey2;
        end_tex_y = tmp_tey1;
    } else {
        x = (int)tmp_xpos;
        length = (int)(tmp_end)-(int)(tmp_xpos)+1;
        start_z = tmp_z;
        end_z = tmp_zpos;
        start_tex_x = tmp_tex1;
        end_tex_x = tmp_tex2;
        start_tex_y = tmp_tey1;
        end_tex_y = tmp_tey2;
    }
    
    // ここいる? load してその後必ず、wait してるように見える。
    // この wait に対応しているloadはないはずだ・・・きっと。
    //smanager->dma_wait(SPAN_PACK_LOAD);
    
    Span *span = &spack->span[spack->info.size++];
    
    span->x          = x;
    span->y          = y;
    span->length_x   = length;
    span->start_z    = start_z;
    span->end_z      = end_z;
    span->tex_x1     = start_tex_x;
    span->tex_x2     = end_tex_x;
    span->tex_y1     = start_tex_y;
    span->tex_y2     = end_tex_y;
    
    /*
     * ここで頂点分法線ベクトルがあったんだけど、
     *  一つだけ取り出して、spanに一つの法線ベクトルを持たしている
     */
    
    span->normal_x    = normal1->x;
    span->normal_y    = normal1->y;
    span->normal_z    = normal1->z;
    
    float tex_x_len = span->tex_x2 - span->tex_x1;
    
    span->tex_width = tex_info->width;
    span->tex_height = tex_info->height;

    /**
     * tex_x_len, tex_y_len を掛ける理由は
     * Changelog の 2008-12-16 を参照
     */
    int scale = getScale(span->length_x, length_y,
                         (int)(span->tex_width*tex_x_len),
                         (int)(span->tex_height*tex_y_len),
                         tex_info->scale_max);
    //scale = tex_info->scale_max;
    
    uint32 *tapestry = getTapestry(tex_info->width,
                                   tex_info->height, scale,
                                   tex_info->addr);
    span->tex_addr   = tapestry;
    span->tex_width  = tex_info->width/scale;
    span->tex_height = tex_info->height/scale;
    
}

/**
 * x軸に水平な辺を持つ三角形ポリゴンから、
 * Span を抜き出す
 *
 * @param[in] spackList    triangle から生成された span を格納する List
 * @param[in] charge_y_top 担当する y の範囲開始地点
 * @param[in] charge_y_end 担当する y の範囲終了地点
 * @param[in] tex_addr     triangle が参照するテクスチャの先頭アドレス
 * @param[in] tex_width    テクスチャの width
 * @param[in] tex_height   テクスチャの height
 * @param[in] tex_scale_max  テクスチャの最大縮小率 (2^n)
 * @param[in] vMin     triangle の座標
 * @param[in] vMid     triangle の座標。triangle を二つに分けて出来た新しい座標
 * @param[in] vMid10   triangle の座標
 * @param[in] length_y  分割する前の Triangle の y の長さ
 * @param[in] tex_y_len 分割する前の Triangle に貼られている Texture の
 *                      長さの割合 (0 ... 1)
 */

static void
half_triangle(SchedTask *smanager, SpanPackPtr *spackList,
			  int charge_y_top, int charge_y_end,
			  TriangleTexInfoPtr tex_info,
			  VertexPack *vMin,VertexPack *vMid,VertexPack *vMid10,
                          NormalPack *normal1, NormalPack *normal2, NormalPack *normal3,
#ifdef USE_SEGMENT
                          /* いや、こういう区切り方は反則か*/
                          MemorySegmentPtr &span_get_ms, MemorySegmentPtr &span_put_ms,
                          MemList *span_ml,
#endif
			  int length_y, float tex_y_len)
{

    int y;

#if 1
    // これじゃないと
    // テクスチャの貼りに微妙に隙間が。謎だ
    int start_y = (int)vMid->y;
    int end_y   = (int)vMin->y;
#else
    float start_y = vMid->y;
    float end_y   = vMin->y;
#endif
    float div_y = start_y - end_y;
    int k = 0;
    int l = 1;

#ifdef USE_SEGMENT


#else

    SpanPackPtr tmp_spack;

#endif

    /**
     * 三角形ポリゴンをx軸に水平に二つに分けようとして
     * ある一辺がすでに水平だった場合、つまり
     *
     * |\
     * | \
     * |  \
     * -----
     *
     *
     * 上のようなポリゴンだった場合は、本来なら上の部分の三角形にだけ
     * half_triangle の処理をするべきだが、現在の処理だと
     * この half_triangle に「上の部分の三角形」と、
     * 「『下の部分の三角形と判断してしまった』直線」が来てしまう。
     * 直線の部分が来ると、calc() で 0 除算とかで、値不定で暴走するので
     * 現在はこれで代用。
     * half_triangle 呼ぶ前にこれを判断できれば良いかもしれない。
     * てかこんなんでいいのかよ。。。
     */
#if 1
    if ((int)div_y == 0) {
	return;
    }
#else
    if (vMid10->x == vMin->x && vMid10->y == vMin->y) {
	return;
    }
#endif

    if (div_y < 0) {
	div_y = -div_y;
	k = 1;
	l = -1;
    }

    for (int i = k; i < (int)div_y+1; i++) {
	y = (int)vMin->y + i*l;

	/**
	 * 担当 y 範囲内
	 */
	if (charge_y_top <= y && y <= charge_y_end) {
	    // 1..8 を index0, 9..16 を index1 にするために y を -1
	    int index = (y-1) / split_screen_h;

	    /**
	     * 違う SpanPack を扱う場合、
	     * 現在の SpanPack をメインメモリに送り、
	     * 新しい SpanPack を取ってくる
	     */

	    if (index != prev_index) {

#ifdef USE_SEGMENT

                smanager->wait_segment(span_put_ms);

                span_put_ms = span_get_ms;
                smanager->put_segment(span_put_ms);

                span_get_ms = smanager->get_segment((memaddr)spackList[index], span_ml);
                smanager->wait_segment(span_get_ms);

                prev_index = index;
                spack = (SpanPackPtr)span_get_ms->data;

#else

		tmp_spack = spack;
		spack = send_spack;
		send_spack = tmp_spack;

		smanager->dma_wait(SPAN_PACK_STORE);
		smanager->dma_store(send_spack, (memaddr)spackList[prev_index],
				    sizeof(SpanPack), SPAN_PACK_STORE);

		smanager->dma_load(spack, (memaddr)spackList[index],
				   sizeof(SpanPack), SPAN_PACK_LOAD);

		prev_index = index;
		smanager->dma_wait(SPAN_PACK_LOAD);

#endif

	    }

	    /**
	     * 書き込む SpanPack が満杯だったら
	     * メインメモリで allocate した領域 (next) を持ってきて
	     * 現在の spack->next につなぎ、next を次の spack とする。
	     * 
	     * -------------------------------------------------------
	     * 
	     * ここどうすっかね。予め、Spanの大きさは予測できるけど、それで毎回SpanPack
	     * allocate するのってはもうやめようって話だよな。Mail Memory 側に ある程度の大きさの
	     * Segment領域を確保して、それをsegmentのAPIでやり取りするのが嬉しいのかね。
	     * 
             * mainMem 追い出すには、ちょっと苦労するかも? 
	     */

	    if (spack->info.size >= MAX_SIZE_SPAN) {
		SpanPackPtr next;
	
		smanager->mainMem_alloc(0, sizeof(SpanPack));
		smanager->mainMem_wait();
		next = (SpanPackPtr)smanager->mainMem_get(0);
		
		spack->next = next;


#ifdef USE_SEGMENT

                smanager->wait_segment(span_put_ms);

                span_put_ms = span_get_ms;
                smanager->put_segment(span_put_ms);

                spackList[index] = next;
                span_get_ms = smanager->get_segment((memaddr)spackList[index],span_ml);
                smanager->wait_segment(span_get_ms);

                spack = (SpanPackPtr)span_get_ms->data;
		spack->init((index+1)*split_screen_h);

#else


		tmp_spack = spack;
		spack = send_spack;
		send_spack = tmp_spack;

		smanager->dma_wait(SPAN_PACK_STORE);
		smanager->dma_store(send_spack, (memaddr)spackList[index],
				    sizeof(SpanPack), SPAN_PACK_STORE);


		spackList[index] = next;
		

		smanager->dma_load(spack, (memaddr)spackList[index],
				   sizeof(SpanPack), SPAN_PACK_LOAD);
		smanager->dma_wait(SPAN_PACK_LOAD);
		spack->init((index+1)*split_screen_h);

#endif

	    }
	} else {
	    /**
	     * 担当範囲外だったら無視
	     */
	    continue;
	}


        span_calc(spack, vMid, vMid10, vMin, 
                  normal1, normal2,  normal3,
                  tex_info, length_y, tex_y_len, div_y, y, i);

    }


}




static int
run(SchedTask *smanager, void *rbuf, void *wbuf)
{
    /*

      get_segmentを使うと、input buffer からの入力は要らなくなる
      Task化するなら、get_segment は取り去る。
      途中でloadが入ってるのは DMA転送のサイズの限界と、SPEのLSの容量の少なさにある
      必要なときに、必要な分だけ load するのは、自動的にやってほしいから、get_segment も
      いづれは、Task の内部で処理されるものになるのかな。
      そうすると、Task の input , output のデータの大きさはスケーラブルになるのか。

    */

    PolygonPack *pp = (PolygonPack*)smanager->get_input(rbuf, 0);


#ifdef USE_SEGMENT

    // global に取ってみた。いづれはひとつにまとめて、サイズを可変にするのかね。
    MemList *pp_ml = (MemList*)smanager->global_get(GLOBAL_POLYGONPACK_LIST);
    MemList *span_ml = (MemList*)smanager->global_get(GLOBAL_SPANPACK_LIST);

    MemorySegmentPtr pp_ms = NULL; //Tileみたいに typedef したほうがいいのか。でもPolygonPackはすでに使われてるし。

    MemorySegmentPtr span_put_ms = NULL; 
    MemorySegmentPtr span_get_ms = NULL; 

#else

    PolygonPack *next_pp = 
	(PolygonPack*)smanager->allocate(sizeof(PolygonPack));

    PolygonPack *free_pp = next_pp;
    PolygonPack *tmp_pp;

#endif

    TrianglePackPtr triPack;
    VertexPackPtr vMin, vMid, vMax;
    VertexPackPtr vMid10
	= (VertexPackPtr)smanager->allocate(sizeof(VertexPack));
    NormalPackPtr normal1,normal2, normal3;
    SpanPackPtr *spackList = (SpanPackPtr*)smanager->get_input(rbuf, 1);

    prev_index = (long)smanager->get_param(0);


#ifdef USE_SEGMENT

    /*rbuf2 はspackList[prev_index]と一緒なんだけど、この書き方は微妙ね*/
    span_get_ms = smanager->get_segment((memaddr)spackList[prev_index], span_ml);
    smanager->wait_segment(span_get_ms);
    spack = (SpanPackPtr)span_get_ms->data;

#else

    spack = (SpanPackPtr)smanager->get_input(rbuf, 2);
    send_spack = (SpanPackPtr)smanager->allocate(sizeof(SpanPack));

    // spack と send_spack は swap しながら DMA を繰り返すので
    // 自分で allocate した send_spack を覚えてないといけない
    SpanPackPtr free_spack = send_spack;


#endif

    int charge_y_top = (long)smanager->get_param(1);
    int charge_y_end = (long)smanager->get_param(2);

    do {
	if (pp->next != NULL) {


#ifdef USE_SEGMENT

            /* 
               Segmentの数は2つにしてその領域のアドレスが交互に返される
            */
 
            pp_ms = smanager->get_segment((memaddr)pp->next, pp_ml);

#else

	    smanager->dma_load(next_pp, (memaddr)pp->next,
			       sizeof(PolygonPack), POLYGON_PACK_LOAD);
#endif

	} else {


#ifdef USE_SEGMENT

            pp_ms = NULL;

#else
	    next_pp = NULL;

#endif


	}

	for (int i = 0; i < pp->info.size; i++) {
	    triPack = &pp->tri[i];

	    TriangleTexInfoPtr tri_tex_info = &triPack->tex_info;

	    make_vertex(triPack, &vMin, &vMid, &vMax, &normal1, &normal2, &normal3);
	    make_vMid10(vMid10, vMin, vMid, vMax);

	    /**
	     * ポリゴンを、x軸に水平に分割して二つの三角形を作り、
	     * それぞれから Span を求める
	     *
	     *      vMax
	     *        |\
	     *        | \
	     *        |  \
	     *        |   \
	     * vMid10 ------ vMid
	     *        |   /
	     *        |  /
	     *        | /
	     *        |/
	     *      vMin
	     *
	     * (vMax, vMid, vMin) という triangle を
	     * (vMax, vMid, vMid10) (vMin, vMid, vMid10) という
	     * 二つの Triangle に分けている
	     */

#ifdef USE_SEGMENT

	    half_triangle(smanager, spackList, charge_y_top, charge_y_end,
			  tri_tex_info, vMin, vMid, vMid10,
                          normal1,normal2,normal3,
                          span_get_ms, span_put_ms, 
                          span_ml,
			  (int)(vMax->y - vMin->y), vMax->tex_y - vMin->tex_y);

	    half_triangle(smanager, spackList, charge_y_top, charge_y_end,
			  tri_tex_info, vMax, vMid, vMid10,
                          normal1,normal2,normal3,
                          span_get_ms, span_put_ms, 
                          span_ml,
			  (int)(vMax->y - vMin->y), vMax->tex_y - vMin->tex_y);

#else

	    half_triangle(smanager, spackList, charge_y_top, charge_y_end,
			  tri_tex_info, vMin, vMid, vMid10,
                          normal1,normal2,normal3,
			  (int)(vMax->y - vMin->y), vMax->tex_y - vMin->tex_y);

	    half_triangle(smanager, spackList, charge_y_top, charge_y_end,
			  tri_tex_info, vMax, vMid, vMid10,
                          normal1,normal2,normal3,
			  (int)(vMax->y - vMin->y), vMax->tex_y - vMin->tex_y);


#endif

	}

#ifdef USE_SEGMENT


        // うーん

        if (pp_ms != NULL) {
            smanager->wait_segment(pp_ms);
            pp = (PolygonPackPtr)pp_ms->data;
        } else {
            pp = NULL;
        }
        
#else

	smanager->dma_wait(POLYGON_PACK_LOAD);	

	tmp_pp = pp;
	pp = next_pp;
	next_pp = tmp_pp;


#endif


    } while (pp);


#ifdef USE_SEGMENT
      
      smanager->wait_segment(span_put_ms);
      span_put_ms = span_get_ms;
      smanager->put_segment(span_put_ms);
      smanager->wait_segment(span_put_ms);

#else

    smanager->dma_wait(SPAN_PACK_STORE);
    smanager->dma_store(spack, (memaddr)spackList[prev_index],
                        sizeof(SpanPack), SPAN_PACK_STORE);
    smanager->dma_wait(SPAN_PACK_STORE);


#endif

#ifdef USE_SEGMENT

    // Global でSegmentとったので、いつか解放しないといかないなぁ。

#else

    free(free_pp);
    free(free_spack);

#endif

    free(vMid10);

    return 0;
}