]> www.wagner.pp.ru Git - openssl-gost/engine.git/blob - gosthash2012.c
Fix Streebog alignment problem
[openssl-gost/engine.git] / gosthash2012.c
1 /*
2  * GOST R 34.11-2012 core functions.
3  *
4  * Copyright (c) 2013 Cryptocom LTD.
5  * This file is distributed under the same license as OpenSSL.
6  *
7  * Author: Alexey Degtyarev <alexey@renatasystems.org>
8  *
9  */
10
11 #include "gosthash2012.h"
12
13 #if defined(_WIN32) || defined(_WINDOWS)
14 # define INLINE __inline
15 #else
16 # define INLINE inline
17 #endif
18
19 #define BSWAP64(x) \
20     (((x & 0xFF00000000000000ULL) >> 56) | \
21      ((x & 0x00FF000000000000ULL) >> 40) | \
22      ((x & 0x0000FF0000000000ULL) >> 24) | \
23      ((x & 0x000000FF00000000ULL) >>  8) | \
24      ((x & 0x00000000FF000000ULL) <<  8) | \
25      ((x & 0x0000000000FF0000ULL) << 24) | \
26      ((x & 0x000000000000FF00ULL) << 40) | \
27      ((x & 0x00000000000000FFULL) << 56))
28
29 /*
30  * Initialize gost2012 hash context structure
31  */
32 void init_gost2012_hash_ctx(gost2012_hash_ctx * CTX,
33                             const unsigned int digest_size)
34 {
35     memset(CTX, 0, sizeof(gost2012_hash_ctx));
36
37     CTX->digest_size = digest_size;
38     if (digest_size == 256)
39         memset(&CTX->h, 0x01, sizeof(uint512_u));
40     else
41         memset(&CTX->h, 0x00, sizeof(uint512_u));
42 }
43
44 static INLINE void pad(gost2012_hash_ctx * CTX)
45 {
46     unsigned char buf[64];
47
48     if (CTX->bufsize > 63)
49         return;
50
51     memset(&buf, 0x00, sizeof buf);
52     memcpy(&buf, CTX->buffer, CTX->bufsize);
53
54     buf[CTX->bufsize] = 0x01;
55     memcpy(CTX->buffer, &buf, sizeof buf);
56 }
57
58 static INLINE void add512(const union uint512_u *x,
59                           const union uint512_u *y, union uint512_u *r)
60 {
61 #ifndef __GOST3411_BIG_ENDIAN__
62     unsigned int CF, OF;
63     unsigned long long tmp;
64     unsigned int i;
65
66     CF = 0;
67     for (i = 0; i < 8; i++)
68     {
69         /* Detecting integer overflow condition for three numbers
70          * in a portable way is tricky a little. */
71
72         /* Step 1: numbers cause overflow */
73         tmp = x->QWORD[i] + y->QWORD[i];
74
75         /* Compare with any of two summands, no need to check both */
76         if (tmp < x->QWORD[i])
77             OF = 1;
78         else
79             OF = 0;
80
81         /* Step 2: carry bit causes overflow */
82         tmp += CF;
83
84         if (CF > 0 && tmp == 0)
85             OF = 1;
86
87         CF = OF;
88
89         r->QWORD[i] = tmp;
90     }
91 #else
92     const unsigned char *xp, *yp;
93     unsigned char *rp;
94     unsigned int i;
95     int buf;
96
97     xp = (const unsigned char *)&x[0];
98     yp = (const unsigned char *)&y[0];
99     rp = (unsigned char *)&r[0];
100
101     buf = 0;
102     for (i = 0; i < 64; i++) {
103         buf = xp[i] + yp[i] + (buf >> 8);
104         rp[i] = (unsigned char)buf & 0xFF;
105     }
106 #endif
107 }
108
109 static void g(union uint512_u *h, const union uint512_u *N,
110               const unsigned char *m)
111 {
112 #ifdef __GOST3411_HAS_SSE2__
113     __m128i xmm0, xmm2, xmm4, xmm6; /* XMMR0-quadruple */
114     __m128i xmm1, xmm3, xmm5, xmm7; /* XMMR1-quadruple */
115     unsigned int i;
116
117     LOAD(N, xmm0, xmm2, xmm4, xmm6);
118     XLPS128M(h, xmm0, xmm2, xmm4, xmm6);
119
120     LOAD(m, xmm1, xmm3, xmm5, xmm7);
121     XLPS128R(xmm0, xmm2, xmm4, xmm6, xmm1, xmm3, xmm5, xmm7);
122
123     for (i = 0; i < 11; i++)
124         ROUND128(i, xmm0, xmm2, xmm4, xmm6, xmm1, xmm3, xmm5, xmm7);
125
126     XLPS128M((&C[11]), xmm0, xmm2, xmm4, xmm6);
127     X128R(xmm0, xmm2, xmm4, xmm6, xmm1, xmm3, xmm5, xmm7);
128
129     X128M(h, xmm0, xmm2, xmm4, xmm6);
130     X128M(m, xmm0, xmm2, xmm4, xmm6);
131
132     UNLOAD(h, xmm0, xmm2, xmm4, xmm6);
133
134     /* Restore the Floating-point status on the CPU */
135     _mm_empty();
136 #else
137     union uint512_u Ki, data;
138     unsigned int i;
139
140     XLPS(h, N, (&data));
141
142     /* Starting E() */
143     Ki = data;
144     XLPS((&Ki), ((const union uint512_u *)&m[0]), (&data));
145
146     for (i = 0; i < 11; i++)
147         ROUND(i, (&Ki), (&data));
148
149     XLPS((&Ki), (&C[11]), (&Ki));
150     X((&Ki), (&data), (&data));
151     /* E() done */
152
153     X((&data), h, (&data));
154     X((&data), ((const union uint512_u *)&m[0]), h);
155 #endif
156 }
157
158 static INLINE void stage2(gost2012_hash_ctx * CTX, const unsigned char *data)
159 {
160     union uint512_u m;
161
162     memcpy(&m, data, sizeof(m));
163     g(&(CTX->h), &(CTX->N), (const unsigned char *)&m);
164
165     add512(&(CTX->N), &buffer512, &(CTX->N));
166     add512(&(CTX->Sigma), &m, &(CTX->Sigma));
167 }
168
169 static INLINE void stage3(gost2012_hash_ctx * CTX)
170 {
171     ALIGN(16) union uint512_u buf;
172
173     memset(&buf, 0x00, sizeof buf);
174     memcpy(&buf, &(CTX->buffer), CTX->bufsize);
175     memcpy(&(CTX->buffer), &buf, sizeof(uint512_u));
176
177     memset(&buf, 0x00, sizeof buf);
178 #ifndef __GOST3411_BIG_ENDIAN__
179     buf.QWORD[0] = CTX->bufsize << 3;
180 #else
181     buf.QWORD[0] = BSWAP64(CTX->bufsize << 3);
182 #endif
183
184     pad(CTX);
185
186     g(&(CTX->h), &(CTX->N), (const unsigned char *)&(CTX->buffer));
187
188     add512(&(CTX->N), &buf, &(CTX->N));
189     add512(&(CTX->Sigma), (const union uint512_u *)&CTX->buffer[0],
190            &(CTX->Sigma));
191
192     g(&(CTX->h), &buffer0, (const unsigned char *)&(CTX->N));
193
194     g(&(CTX->h), &buffer0, (const unsigned char *)&(CTX->Sigma));
195     memcpy(&(CTX->hash), &(CTX->h), sizeof(uint512_u));
196 }
197
198 /*
199  * Hash block of arbitrary length
200  *
201  */
202 void gost2012_hash_block(gost2012_hash_ctx * CTX,
203                          const unsigned char *data, size_t len)
204 {
205     size_t chunksize;
206
207     while (len > 63 && CTX->bufsize == 0) {
208         stage2(CTX, data);
209
210         data += 64;
211         len -= 64;
212     }
213
214     while (len) {
215         chunksize = 64 - CTX->bufsize;
216         if (chunksize > len)
217             chunksize = len;
218
219         memcpy(&CTX->buffer[CTX->bufsize], data, chunksize);
220
221         CTX->bufsize += chunksize;
222         len -= chunksize;
223         data += chunksize;
224
225         if (CTX->bufsize == 64) {
226             stage2(CTX, CTX->buffer);
227
228             CTX->bufsize = 0;
229         }
230     }
231 }
232
233 /*
234  * Compute hash value from current state of ctx
235  * state of hash ctx becomes invalid and cannot be used for further
236  * hashing.
237  */
238 void gost2012_finish_hash(gost2012_hash_ctx * CTX, unsigned char *digest)
239 {
240     stage3(CTX);
241
242     CTX->bufsize = 0;
243
244     if (CTX->digest_size == 256)
245         memcpy(digest, &(CTX->hash.QWORD[4]), 32);
246     else
247         memcpy(digest, &(CTX->hash.QWORD[0]), 64);
248 }